„Mich reizt die Vielfalt von Data Science Consulting“
Interview mit einem unserer Machine Learning-Experten
Was ist Deine Aufgabe im Rahmen unserer Data Science Consulting-Projekte?
Ich arbeite hier als Machine Learning-Programmierer und kümmere mich zusätzlich um Datenanalysen. Das heißt, dass ich Informationen und Zusammenhänge aus großen Datenmengen heraushole. Diese Daten können Text, Bilder, Videos oder auch Trackinginformationen sein.
In unseren Projekten geht es darum, Daten in handlungsrelevante Informationen zu verwandeln. Hierfür setzen wir auf modernste Methoden der Datenanalyse und des Machine Learnings, um beispielsweise Vorhersagen zu treffen oder Muster zu erkennen. Mein Ziel ist es, unseren Kunden dabei zu helfen, fundierte Entscheidungen auf Basis von Daten zu treffen und ihr Geschäftspotenzial voll auszuschöpfen.
Darüber hinaus sehe ich es als meine Aufgabe, unsere Kunden bei der Implementierung von Machine Learning-Lösungen zu unterstützen und ihnen das notwendige Know-how zu vermitteln. Denn nur so können sie auch in Zukunft von den Vorteilen datengetriebener Entscheidungen profitieren.
Was reizt Dich besonders Teil einer Beratungsagentur für Data Science zu sein?
Es ist toll, dass meine Aufgabe einen direkten Mehrwert für unsere Kunden hat. Ich finde diejenigen Informationen, mit denen ihre Angebote, Customer Journeys und strategischen Entscheidungen besser werden.
Meine Daten sind je nach Fragestellung super unterschiedlich. Mich reizt die Vielfalt unserer Beratungsprojekte im Bereich Data Science. Je nach Projekt beschäftige ich mich mit Bildverarbeitung, mit Textanalysen und mit Zeitreihen. Am meisten Spaß macht die Suche nach der passenden Machine Learning-Methode für den jeweiligen Anwendungsfall; denn die unterschiedlichen Algorithmen haben je nach Einsatzbereich ihre Vor- und Nachteile.
Was sind typische Anforderungen im Bereich Data Science Consulting?
Datenanalysen zur Mustererkennung oder Zielgruppensegmentierung beginnen immer mit dem Säubern und Strukturieren der Daten. Anschließend wählen wir Algorithmen aus, die zum Datensatz und der Fragestellung passen.
Dazu gehören auch Performancevergleiche verschiedener Algorithmen im Hinblick auf die spezifischen Kundenherausforderungen und die Möglichkeiten der Datensätze. Die wichtigste Aufgabe ist dabei das modellieren der Daten. Die Modelle, die letztlich im Livebetrieb verwendet werden sollen, um die gesuchten Informationen aus neuen Daten vorherzusagen, müssen dabei auf einen optimalen Fit gebracht werden. Und die Kundendaten sind permanent in Bewegung und Veränderungen unterworfen – genauso müssen die Modelle und Ergebnisse selbst nach Release überwacht und adaptiert werden.
Was hat Maschinelles Lernen mit Künstlicher Intelligenz zu tun?
Künstliche Intelligenz ist das übergeordnete Konzept – quasi eher ein Marketing-Buzzword- zu dem auch Machine Learning gehört. Machine Learning-Verfahren sind eine der wichtigsten Voraussetzungen für die systematische Erarbeitung von komplexer KI-Software.
Anm. d. Red.: Bitte beachtet auch unseren bestehenden Beitrag dazu.
Kannst Du in aller Kürze Deep Learning und Machine Learning voneinander abgrenzen?
Deep Learning ist aktuell sehr populär und sehr stark. Beim Deep Learning wird ein Netzwerk aus unterschiedlichen Neuronen und Schichten zur Mustererkennung eingesetzt. Deep Learning ist ein Teil von Machine Learning. Quasi ein Werkzeug von vielen in meiner Werkzeugkiste. Deep Learning wird sehr häufig z.B. im Zusammenhang mit Bilderkennung eingesetzt, denn dort funktioniert es sehr gut. Auf anderen Daten muss es aber auch nicht das Werkzeug der ersten Wahl sein. Je nach Einsatzbereich funktioniert Deep Learning besser oder schlechter, es kommt immer auf den Anwendungsfall, die Daten und viele andere Faktoren an, die ich im Rahmen des Projektes zur Verfügung habe.
Warum ist erscheint Data Science Consulting manchmal so kompliziert?
Ein erfolgreiches Projekt steht und fällt nicht nur mit der Auswahl der richtigen Algorithmen und der passenden Datenmodellierung. Die gesamte technische Klaviatur muss korrekt aufeinander eingestellt sein. Bei der Echtzeit-Personalisierung mit Künstlicher Intelligenz zum Beispiel braucht man viel Rechenpower und effiziente Algorithmen, die auf wenigen und teilweise auch sehr dynamischen Daten maximale Ergebnisse ausgeben. Da spielt das Thema Genauigkeit eine große Rolle, die im Sinne einer guten Performance manchmal auch weniger hoch sein muss, wie in anderen Anwendungsfällen. Die Server müssen schnell reagieren.
Die gesamte Wertschöpfung muss penibel aufeinander abgestimmt sein, um hocheffizient zu arbeiten – wie in einem Formel-1-Wagen. Daher müssen alle Systemteile sehr schnell aufeinander reagieren und im Problemfall eben auch die Fallbacks kennen. Vom Tracking, welches die User-Session erkennt, über die eigentliche Vorhersage durch das System bis hin zum ausliefernden Javascript, was den Content in wenigen Millisekunden an den User im Frontend ausgibt – alles muss exakt ineinander greifen, damit der Nutzer selbst nicht irritiert wird, oder die Usability der Website leidet.
Jetzt mal aus dem Nähkästchen: Was ist die größte Stärke Eures Data Science-Teams?
Wir sind ein vergleichsweise kleines Team. Dadurch können wir uns sehr schnell abstimmen. Wir bringen ganz unterschiedliche Erfahrungen und Expertisen mit. Das hilft uns bei den sehr unterschiedlichen Projekten und Technologien, mit denen wir jonglieren.
Und ich denke unsere Start-Up-Kultur ist ein Vorteil. Wir dürfen auch mal unkonventionelle Lösungen ausprobieren. Wenn es dem Kunden nützt, dann gibt es eigentlich keine Restriktionen.
Super, vielen Dank für das Gespräch!