[et_pb_section fb_built=“1″ admin_label=“section“ _builder_version=“4.16″ global_colors_info=“{}“][et_pb_row admin_label=“row“ _builder_version=“4.16″ background_size=“initial“ background_position=“top_left“ background_repeat=“repeat“ global_colors_info=“{}“][et_pb_column type=“4_4″ _builder_version=“4.16″ custom_padding=“|||“ global_colors_info=“{}“ custom_padding__hover=“|||“][et_pb_text admin_label=“Text“ _builder_version=“4.16″ background_size=“initial“ background_position=“top_left“ background_repeat=“repeat“ global_colors_info=“{}“]
Ein typisches KI Projekt umfasst die folgenden 4 Phasen: Problem definieren, Daten aufbereiten, Modell trainieren und Vorhersagen treffen. Dauer und Aufwand der einzelnen Phasen hängen natürlich vom Umfang der Aufgabenstellung ab (in Klammern finden Sie die Anteile, die nach unserer Erfahrung als Richtschnur benutzt werden können).
1 Fragestellung formulieren (20%)
In der ersten Phase wird zunächst das Problem analysiert und präzisiert. Um eine KI sinnvoll einsetzen zu können, muss es sich um eine datengetriebene Fragestellung handeln, d.h. die Herausforderung muss sich mit Hilfe von Mustern in den Daten lösen lassen. Ist dies nicht der Fall, lassen sich ggf. Lösungen durch klassisches Programmieren finden.
Außerdem werden die nächsten Phasen „durchgespielt“, um Verantwortlichkeiten zu identifizieren und mögliche Schwierigkeiten zu lösen. Insbesondere die Datenaufbereitung (Punkt 2) erfordert viele Absprachen, um den Aufwand möglichst gering zu halten.
Neben den technischen und organisatorischen Einschätzungen zur Durchführbarkeit sollte eine Aufwandsabschätzung erfolgen, um die Kosten gegen den Nutzen abzuwägen.
Sobald die Entscheidung zur Durchführung des KI Projektes gefällt wurde, werden die verschiedenen Aspekte schriftlich fixiert. Zur Dokumentation kleiner Projekte benutzen wir iThoughts, einer MindMapping Software, die um einige Module zur Projektarbeit erweitert wurde. Für größere Projekte benutzen wir Microsoft Project, insbesondere wenn zusätzlich externe Dienstleister eingebunden werden.
2 Daten aufbereiten (40%)
In der 2. Phase werden die vorhandenen Daten für das KI Projekt gesammelt, gesichtet und in eine für die künstliche Intelligenz lesbare Form gebracht. Oftmals wird zunächst ein kleinerer Datensatz erzeugt, um das Training in der nächsten Phase in Form eines Prototypen-Modells zu testen. Dies gibt hilfreiche Hinweise zum weiteren Vorgehen mit den Daten, beispielsweise ob Informationen fehlen oder überflüssige Daten mitgeschleppt wurden. Im Blog finden Sie noch weitere Tipps für eine robuste Datenstrategie.
3 Modell trainieren (30%)
Die Daten werden zunächst in Trainings- und Testdaten aufgeteilt (Split), mit denen das Modell unabhängig trainiert und getestet werden kann (ohne dass es zu Überschneidungen kommt).
Eigentlich müsste hier Modell im Plural stehen, weil typischerweise mehrere (iterative) Versuche notwendig sind, um das finale Modell zu trainieren. Die Variationen liegen zum einen in den unterschiedlichen Algorithmen, die für das jeweilige Problem zu Verfügung stehen. Diese unterscheiden sich in einigen Fällen qualitativ voneinander, so dass man den für ein Problem optimalen Algorithmus direkt auswählen kann (Beispiel). Wenn dies nicht der Fall ist, müssen mehrere Algorithmen miteinander verglichen werden.
Außerdem besitzt jeder Algorithmus verschiedene (Hyper-)Parameter, mit denen sozusagen ein Finetuning stattfindet.
Die Qualität des jeweiligen Modells wird mit Hilfe der Testdaten evaluiert. Dazu werden statistische Größen wie der Abweichung zwischen erwarteter Vorhersage und Ausgabe des Modells berechnet. Ist dieser Wert klein, spricht das für eine gute Vorhersage des Modells.
4 Vorhersagen treffen (10%)
Wenn der Kunde mit den Ergebnissen des Modells zufrieden ist, wird dies in eine Umgebung „ausgerollt“, von wo aus die beteiligten Benutzergruppen auf die Vorhersagen des Modells zugreifen können. Dazu gehört natürlich auch deren Schulung sowie Anpassungen aufgrund des Feedbacks.
Einige Arbeiten können bereits nach Erstellung des Prototypen-Modells während der 2. Phase begonnen und in Phase 3 fortgesetzt werden, um die Dauer der 4. Phase möglichst gering zu halten.
Bei manchen Aufgabenstellungen muss das Modell von Zeit zu Zeit mit aktualisierten Daten „nachtrainiert“ werden, damit die Vorhersagen dauerhaft verlässlich bleiben.
[/et_pb_text][/et_pb_column][/et_pb_row][/et_pb_section]
Schreibe einen Kommentar