Maschinelles Lernen
Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz, dessen Ziel es ist, Algorithmen und Modelle zu entwickeln, die es Maschinen ermöglichen, aus Daten zu lernen und Vorhersagen zu treffen, ohne ihre Logik explizit zu programmieren.
Worin unterscheidet sich maschinelles Lernen von herkömmlicher Programmierung?
In der traditionellen Programmierung bildet der Entwickler (Programmierer) zum Beispiel die Geschäftslogik explizit ab, auf deren Grundlage eine Entscheidung getroffen werden soll. Das heißt, der Programmierer erhält eine Geschäftsanforderung (Input) und schreibt ein Programm, das genau das tut, was in der Anforderung festgelegt wurde.
Im Fall der Künstlichen Intelligenz definieren wir nicht im Voraus, nach welchen Kriterien wir eine geschäftliche Entscheidung treffen möchten. Stattdessen übergeben wir Daten an einen Lernalgorithmus, der aus diesen Daten die zugrunde liegende Geschäftslogik lernt. Der KI-Entwickler (Data Scientist) verwendet also Daten als Eingabe, und das Ergebnis dieses Prozesses ist ein trainiertes Modell.
Welche Arten des maschinellen Lernens gibt es?
überwachtes Lernen
Im Lernprozess erhält der Algorithmus Daten, bei denen bekannt ist, welcher Klasse jede Beobachtung angehört (Zielvariable). Zum Beispiel, ob eine Banktransaktion betrügerisch war oder nicht. Auf diese Weise kann der Algorithmus lernen, wie er den Wert der Zielvariable aus den übrigen verfügbaren Daten (Eingangsvariablen) ableiten kann.
Im Geschäftsleben ist dies eine der am häufigsten angewandten Methoden. Ihr großer Vorteil besteht darin, dass wir die Genauigkeit des trainierten Modells anhand historischer Daten testen können.
Die am häufigsten verwendeten Verfahren innerhalb des überwachten Lernens sind:
- Regression: Unser Ziel ist es, einen kontinuierlichen Zahlenwert zu schätzen, wie zum Beispiel die Vorhersage eines Aktienkurses.
- Klassifikation: Unser Ziel ist es, Beobachtungen in verschiedene Klassen einzuordnen, zum Beispiel:
- "Hat ein bestimmter Kunde Interesse an einem speziellen Service oder nicht?"
- "Wird ein bestimmtes Medikament bei einer speziellen Krankheit wirksam sein oder nicht?"
Unterricht fortsetzen (Feinabstimmung)
In diesem Fall verfeinern wir ein Modell, das bereits umfassend trainiert wurde, auch von anderen. Ein gutes Beispiel dafür ist der Bereich der Bilderkennung, in dem zahlreiche vortrainierte Modelle existieren, die Objekte bereits sehr gut identifizieren können. Diese Modelle lassen sich jedoch weiter anpassen und optimieren, um spezifischere Anforderungen zu erfüllen.
Unüberwachtes Lernen
Eines der am häufigsten angewandten Beispiele für diese Lernmethode in der Geschäftswelt ist das Clustering, auch als Gruppierung bekannt (zum Beispiel die Segmentierung von Kunden zu Marketingzwecken). Bei diesem Verfahren versucht der Algorithmus, die Daten so zu gruppieren, dass ähnliche Kunden in dieselbe Gruppe und unterschiedliche Kunden in verschiedene Gruppen eingeordnet werden.
Verstärkungslernen
Beim verstärkenden Lernen erhält der Algorithmus fortlaufend neue Daten, die er in seine Wissensbasis integriert und sich dadurch selbst 'intelligenter' macht. Diese Methode wird häufig in der Robotikentwicklung und bei der Erstellung großer Sprachmodelle (Large Language Models, LLMs) angewendet.
Es ist wichtig, auch Empfehlungssysteme (Recommendation Engines) hervorzuheben, die in der Regel mehrere der oben genannten Lernmethoden kombinieren, um eine ausgeklügelte und umfassende Empfehlungslogik zu realisieren.
Woran erkennen wir, dass die KI die Aufgabe richtig gelernt hat?
Ein wesentlicher Bestandteil des Trainings von Modellen der Künstlichen Intelligenz ist die Überprüfung und Validierung des trainierten Modells. Grob gesagt, besteht dieser Prozess aus zwei Hauptkomponenten:
Statistische Validierung: Hierbei werden verschiedene statistische Methoden verwendet, um zu überprüfen, wie genau das Modell seine Aufgaben erfüllt. Je nachdem, welche Art von Problem das Modell lösen soll, müssen unterschiedliche Methoden angewandt werden, um die Genauigkeit seiner Leistung zu bewerten.
Geschäftliche Validierung: Natürlich kann nicht alles nur mit Statistiken überprüft werden, daher ist die geschäftliche Überprüfung von entscheidender Bedeutung. In dieser Phase suchen wir Antworten auf Fragen wie: 'Welchen Einfluss wird es auf meine gesamten Geschäftsabläufe haben, wenn ich einen Teil meiner Entscheidungen mit dem entwickelten Modell treffe?
Aus welchen Hauptschritten besteht die Entwicklung eines KI-Modells?
Die Entwicklung von KI-Modellen lässt sich grundsätzlich in zwei Hauptteile unterteilen:
1) Entwicklung von Lernalgorithmen: Dies ist eher forschungsorientierte Arbeit, bei der versucht wird, einen völlig neuen Ansatz im Bereich des maschinellen Lernens zu entwickeln. Dies kann die Schaffung eines völlig neuen Algorithmus oder die Entwicklung einer neuartigen Variante eines bestehenden Verfahrens umfassen. Im Geschäftsleben ist dies seltener.
2) Anwendung vorhandener Lernalgorithmen: Dies beinhaltet die Verwendung und Feinabstimmung eines bestehenden Lernalgorithmus mit einem Datensatz, der auf ein spezifisches geschäftliches Problem zugeschnitten ist. Das Ergebnis ist ein trainiertes Modell, das zur Lösung des jeweiligen geschäftlichen Problems eingesetzt werden kann.
Hauptschritte beim Trainieren von Maschinenlernmodellen:
- Problembeschreibung
- Datensammlung und Datenvorverarbeitung
- Erstellung von Trainings- und Testdatensätzen
- Auswahl eines Maschinenlern-Algorithmus
- Modeltraining
- Modellbewertung
- Modellbereitstellung und -überwachung
Bei welchen geschäftlichen Herausforderungen kann maschinelles Lernen erfolgreich eingesetzt werden?
Nicht abschließend, aber hier sind einige Anwendungsbereiche:
- Gesundheitswesen: Unterstützung bei der Diagnose, Prognose und der Erstellung von Behandlungsplänen. Unterstützung bei der Auswertung von Röntgen-, CT- und MRT-Bildern.
- Finanzen: Betrugserkennung, Kreditantragsbewertungssysteme, algorithmischer Handel.
- Telekommunikation: Cross-Selling, Netzwerk-Analyse, Betrugserkennung.
- Einzelhandel: Personalisierte Werbung, Preisgestaltung, Bestandsplanung.
- Fertigung: Effizienzsteigerung, Qualitätssicherung, Fehlerprognose.
"Zusammenfassend lässt sich sagen, dass in nahezu jeder Branche Bereiche vorhanden sind, in denen maschinelles Lernen erheblich zur Optimierung von Prozessen beitragen kann.
Welche Werkzeuge können wir zur Entwicklung von KI-Modellen verwenden?
Zur Entwicklung von Maschinenlernmodellen ist Python derzeit die am weitesten verbreitete Programmiersprache. Fast jeder größere Anbieter—sei es in der Cloud oder vor Ort—bietet eine Umgebung, in der ML-Modelle mit Python entwickelt werden können.
Darüber hinaus gibt es heute zahlreiche Werkzeuge auf dem Markt, die die Modellierung über grafische Schnittstellen auf Basis von Low-Code- / No-Code-Prinzipien ermöglichen:
- Google Vertex
- Azure ML
- Amazon Sagemaker
- IBM Watson
- KNIME