Herr Behrendt, Sie beschäftigen sich damit, wie Porsche Consulting mit künstlicher Intelligenz und Methoden der Datenanalyse Unternehmen dabei helfen kann, Daten auszuwerten, um nützliche Erkenntnisse daraus zu gewinnen. Zunächst einmal: Um was für Daten geht es da eigentlich, mit denen Sie arbeiten?
Behrendt: Das lässt sich so pauschal gar nicht sagen, sondern ist immer abhängig vom konkreten Projekt. Neben strukturierten Daten, die in Tabellenform vorliegen und häufig numerische Werte beinhalten, gibt es auch immer mehr Projekte, in denen unstrukturierte Daten in Form von Text anfallen. Hier kommen dann auch ganz andere Methoden, speziell aus dem Bereich Natural Language Processing (NLP), zum Einsatz. Generell ist es so, dass die Datenverfügbarkeit und -qualität häufig das erste große Hindernis in Projekten darstellt. Auch die besten Modelle bringen leider nur wenig oder keinen Mehrwert ohne eine saubere Datenbasis.
Wenn man an Daten denkt, denkt man in der Regel an Excel-Tabellen. Was sind das denn für Daten, die in Textform anfallen?
Behrendt: Tatsächlich liegt ein Großteil von Unternehmensdaten als Text vor. Wir haben uns beispielsweise einmal Kundenbeschwerden eines Unternehmens angeschaut, die in Form von E-Mails gesammelt wurden. Bei einer kritischen Masse an solchen Kundenbeschwerden ist es für Mitarbeiterinnen und Mitarbeiter im Kundenservice sehr aufwendig, die Kundenbeschwerden zeitnah zu bearbeiten. Hier können NLP-Methoden helfen, um E-Mails automatisiert zu klassifizieren und an die richtigen Stellen zu leiten, damit der Kundenservice seine Arbeit noch effizienter machen und das Unternehmen letztendlich die Kundenzufriedenheit steigern kann. Neben der richtigen Methodik muss im zweiten Schritt auch die Operationalisierbarkeit der Lösung sichergestellt werden – also die Nutzbarkeit im täglichen Betrieb. Ohne, dass jemand mühsam einzelne Skripte mit Code ausführen muss. Das ist auf jeden Fall erstmal eine Umstellung, wenn man aus der Wissenschaft kommt, wo man auf so etwas häufig eher weniger achtet.
Können Sie mir näher erläutern, was genau beim Natural Language Processing vor sich geht? Versteht die künstliche Intelligenz, was in den E-Mails geschrieben steht?
Behrendt: Nein, die KI versteht das nicht im kognitiven Sinne. Man kann sich das so vorstellen, dass verschiedene mathematische Operationen ausgeführt werden, basierend auf den vorliegenden Daten. Bei der Klassifizierung von Beschwerde-E-Mails bedeutet das ganz konkret, dass die Texte im ersten Schritt in eine numerische Repräsentation gebracht werden müssen – am Ende soll ein gegebener Text in Form eines Vektors ausgedrückt werden, dessen Einträge Zahlen sind. Man spricht hier auch von einer semantischen Repräsentation. Texte – ausgedrückt als Vektoren – sollen im semantischen Raum dann nah beieinander liegen, falls sie von der Bedeutung her ähnlich zueinander sind. Wenn wir uns z.B. Kundenbeschwerden einer Fluglinie vorstellen, würden zwei Beschwerden über verlorenes Gepäck näher beieinander liegen als eine Beschwerde über verlorenes Gepäck und eine andere Beschwerde über eine Flugverspätung. Anhand solcher semantischen Repräsentationen kann man E-Mails dann ziemlich genau klassifizieren.
Über NLP-Methoden kann man auch sehr gut neue Daten generieren, die man für andere Analysen nutzen kann. Zum Beispiel kann man die Stimmungslage von Investoren über Social Media Posts analysieren und dann in Prognosemodelle integrieren – das war damals noch ein Teil von meiner Doktorarbeit. NLP-Methoden sind also immer auch Wegbereiter für die anderen Bereiche, mit denen unser Team sich inhaltlich beschäftigt: Kausalanalysen, Prognosemodelle und mathematische Optimierung.
Mit NLP-Methoden lassen sich Daten also gut analysieren und kategorisieren. Was ist mit dem nächsten Schritt: mit der Beantwortung von Kundenbeschwerden? Bei Konzernen hat man ja oft das Gefühl, dass man es am Anfang nicht mit Menschen, sondern Maschinen zu tun hat, die einem vorgefertigte Antworten liefern. Lassen sich im Hintergrund über die Vektoren auch mögliche Antworten mit Anfragen verbinden?
Behrendt: Genau, man kann NLP-Methoden in diesem Fall natürlich auch benutzen, um Antworten auf Kundenbeschwerden zu generieren. Dabei muss das System auf von Menschen geschriebene Beschwerde-Antwort Paare trainiert werden. Vor allem muss man aber schauen, dass auf die Antworten auch entsprechende Taten folgen – z.B. bei Rekompensationszahlungen – und die Antworten faktisch richtig sind. Es wäre z.B. ungünstig, wenn nicht die korrekte Telefonnummer vom Servicecenter angegeben wird.
Wenn wir vom Kundenmanagement absehen: In welchen Bereichen lässt sich die künstliche Intelligenz noch einsetzen, um Daten zu analysieren?
Behrendt: Überall dort, wo ausreichend Daten anfallen. Aus Unternehmenssicht ist es aber immer entscheidend, einen ganz konkreten Use Case ins Auge zu fassen, mit dem auch ein klarer Nutzen generiert wird. Auf der einen Seite sollte man vermeiden einen Use Case umzusetzen, nur weil der Begriff „künstliche Intelligenz“ im Titel erwähnt wird, ohne den genauen Nutzen herausstellen zu können. Auf der anderen Seite geht es aber auch darum, eine Blockadehaltung abzubauen, die dadurch entsteht, dass oft gar nicht klar ist, was sich hinter der „künstlichen Intelligenz“ versteckt, die einen Use Case so besonders machen soll. Eine realistische Einschätzung ist hier wichtig, um Chancen und Herausforderungen abwägen zu können.
Wie bereits erwähnt, muss aber zuerst die Verfügbarkeit und Qualität von Daten sichergestellt werden - was einfacher gesagt ist als getan, da es hier nicht nur um technische Aspekte, sondern auch Governance-Gesichtspunkte geht. Auf einer soliden Datengrundlage lassen sich dann – je nach Unternehmen - verschiedenste Use Cases ableiten: von der Prognose der Produktnachfrage über die optimale Auslastung eines Transportnetzwerks bis hin zur Prüfung von Finanztransaktionen auf einen Geldwäscheverdacht.
Die ersten analytischen Fähigkeiten haben Sie unter anderem an der ZU entwickelt. Womit haben Sie sich in Ihrer Promotion genau beschäftigt?
Behrendt: In meiner Promotion habe ich mich mit zwei verschiedenen Themen zu Zeitreihen – Daten gemessen über die Zeit – beschäftigt, die ich am Ende aber gut kombinieren konnte.
Zum einen habe ich untersucht, ob und wie man die Aufmerksamkeit und Stimmungslage von Investoren aus Social Media Posts und Online-Suchanfragen extrahieren und in Anwendungen der empirischen Finanzmarktforschung nutzen kann. Bei diesen Anwendungen ging es unter anderem um die Prognose der Volatilität von Aktienrenditen.
Zum anderen habe ich mich mit statistischen Ansätzen zur Schätzung von Strukturbrüchen und informationstheoretischen Ansätzen zur Quantifizierung des Informationsflusses zwischen verschiedenen Zeitreihen beschäftigt. Das Schätzen von Strukturbrüchen – also Änderungen in den Daten, die dazu führen, dass die Parameter eines Modells, mit dem wir die Daten auswerten, sich ebenfalls ändern – ist interessant, weil viele Modelle gewisse Annahmen an die Daten stellen und Parameter haben, die über die Zeit konstant sind. Falls Strukturbrüche vorliegen, sind diese Annahmen verletzt. Strukturbrüche datengetrieben zu bestimmen, ist tatsächlich gar nicht so einfach. Wenn ich mit meinem Modell gewisse Vorhersagen machen möchte, dann kann es aber durchaus Sinn machen, Strukturbrüche, und damit Änderungen im Prognosemodell, zu berücksichtigen.
Mit den informationstheoretischen Ansätzen konnte ich daneben auf eine sehr flexible Weise untersuchen, in welche Richtung die Information zwischen verschiedenen Zeitreihen fließt. Ein Anwendungsfall könnte hier sein, dass man wissen möchte, ob Bewegungen auf dem Aktienmarkt dazu führen, dass Investoren online nach bestimmten Aktien suchen oder umgekehrt.
Sie sind eine hochspezialisierte Fachkraft. Wenn Sie eine Prognose abgeben müssten, wie denken Sie über die Zukunft Ihrer Arbeit? Werden Menschen mit Ihren Fähigkeiten bald überall gesucht werden oder wird das wenigen Spezialisten vorbehalten bleiben, die entsprechend tiefgehende Ausbildungen genossen haben.
Behrendt: Es gibt natürlich auch in der Beratungsbranche Unternehmen mit unterschiedlichen Ausrichtungen sowie verschiedene Fach- und Boutique-Beratungen mit Schwerpunkten abseits von Datenthemen – generell denke ich aber schon, dass in Zukunft Fähigkeiten im Bereich der Datenanalyse immer wichtiger werden. Unsere Kunden verlangen in der Regel Lösungen abseits von Hochglanzfolien mit ein paar Buzzwords. Auf der einen Seite gibt es immer mehr Projekte mit Fokus auf Datenthemen, bei denen man in der Lage sein muss, die technischen Details und Analysemethoden zu verstehen. Allerdings sollten auch Strategieprojekte die Umsetzung immer mitdenken und dafür muss man am Ende beispielsweise auch mal eine Anwendung als Prototypen bereitstellen und im Anschluss operationalisieren und ausrollen können.
Das Schöne ist aber, dass es nicht den „einen“ Ausbildungsweg in unserem Bereich gibt, sondern das Feld sehr interdisziplinär ist. Natürlich braucht man eine quantitative Ausrichtung im Studium, muss die Mathematik hinter den Modellen verstehen und sollte sich gerne mit technischen Lösungsmöglichkeiten befassen – aber ein fachlicher Fokus wie Maschinenbau oder Finanzwirtschaft ist ebenso wichtig, um zu wissen, was die Daten einem sagen. Kommunikativ sollte man auf jeden Fall auch sein, da man in der Beratung immer viel mit Menschen zu tun hat. Die typischen Fähigkeiten von Beraterinnen und Beratern werden also nicht unwichtig, sie werden in Zukunft aber durch neue Fähigkeiten ergänzt.