AutoML als Weg zum (echten) datengesteuerten Unternehmen
Maschinelles Lernen (ML) trägt heute schon massiv dazu bei, Geschäftsprozesse zu automatisieren. Doch das Training von Algorithmen kostet viel Zeit und Arbeit und bindet Fachkräfte. Automatisches Machine Learning (AutoML) bietet einen Ausweg – vorausgesetzt, die Datenqualität stimmt.
Die rasante digitale Transformation hat dafür gesorgt, dass auch hierzulande die Bedeutung eines datengesteuerten Geschäftsansatzes für die Zukunftsfähigkeit von Unternehmen erkannt wurde. Dieser Wandel wird in erster Linie durch die zunehmende Nutzung, Verbreitung und Demokratisierung von Daten sowie durch die Geschwindigkeit, mit der sie erfasst und genutzt werden, vorangetrieben. Eins ist klar: die Menge der analysierten Daten wird weiter zunehmen, da die Unternehmen mit immer größeren und komplexeren Datensätzen konfrontiert werden.
In vielen Unternehmen sind Daten immer noch Herrschaftswissen in den Händen einiger weniger Experten.
In diesem Umfeld erwarten Führungskräfte schnelle datengesteuerte Ergebnisse. Gleichzeitig hinken die Geschäftsprozesse hinterher, da meist noch nicht alle Unternehmensbereiche datengetrieben arbeiten und häufig der Austausch zwischen den Abteilungen und die entsprechende Kultur im Unternehmen fehlen. In vielen Prozessen sind Daten immer noch Herrschaftswissen in den Händen einiger weniger Experten, was zu fehlender Akzeptanz der Datennutzung innerhalb der Teams führen kann. Das alles hat zur Folge, dass die Unternehmen nach wie vor nicht das volle Potenzial ausschöpfen, das ihnen Datennutzung bietet und viele Möglichkeiten ungenutzt liegen lassen. Die Verwaltung und effiziente Nutzung der Daten bleibt eine zentrale Herausforderung.
Bessere Datenqualität = effizientere Nutzung für das Business
Bei der Arbeit mit Daten gibt es keine „One size fits all“-Lösung. Doch je mehr Daten zur Verfügung stehen, desto besser sind Unternehmen in der Lage, mögliche Geschäftsrisiken zu minimieren, das Wachstum zu fördern, ihre Geschäftsziele zu erreichen und gegebenenfalls zu adaptieren. Chief Data Officers (CDOs), sofern bereits in den Unternehmen vorhanden, sind häufig Dreh- und Angelpunkt zwischen datengesteuertem Erfolg und Misserfolg. Doch die Wahrheit ist, dass sie durch technologische oder logistische Herausforderungen noch viel zu oft ausgebremst werden.
Da die Zeit von der Bereitstellung bis zur Verfügbarkeit der Daten weiterhin ein wichtiger Punkt und ein entscheidender Wettbewerbsvorteil ist, müssen CDOs alle verfügbaren Tools und Ressourcen in ihrem aktuellen Tech-Stack nutzen, um die Abläufe, insbesondere die Datenanalyse, möglichst schnell und effizient zu gestalten. Hier setzen die Möglichkeiten der Künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) an. „Work smart, not hard“ ist hier die Devise und diese innovativen Technologien spielen dabei eine wesentliche Rolle – so können Datenteams in kürzerer Zeit mehr Wert aus den vorhandenen Daten ziehen.
Machine Learning hilft heute bereits in vielen Bereichen, über automatisierte Prozesse wiederkehrende Abläufe in Unternehmen effizienter zu gestalten und so menschliche Ressourcen zu schonen – Kundenanfragen, Reklamationsmanagement oder Predictive Analytics sind gute Beispiele dafür. Das Problem: Für den Aufbau einer robusten ML-Pipeline sind mehrere komplexe Schritte erforderlich. Vielen Unternehmen fehlen dazu die Zeit und erst recht die Experten.
Die Rolle von KI/ML in der Datenanalyse
Ein Schlüsselfaktor, der einer effektiven Datenstrategie und Datennutzung im Wege steht, ist die Tatsache, dass die realen Daten oft nicht „sauber“ sind. Laut dem Deloitte-Bericht Analytics Advantage wird mehr als die Hälfte (66 %) der Unternehmensdaten aktuell als minderwertig eingestuft. Sind aber die vorliegenden Informationen nicht von hoher Qualität, können sich Teams leicht verzetteln und viel zu viel Zeit mit der Bereinigung und Vorbereitung der Daten für die Analyse verbringen. Da Daten oft über mehrere Systeme hinweg erstellt und gemeinsam genutzt werden, können externe Daten den internen Entscheidungsfindungsprozess erheblich beeinflussen, was zu einem zusätzlichen Zeitaufwand für die Bereinigung und den Zugriff auf qualitativ hohe Daten führt.
Die Automatisierung kann hierbei den entscheidenden Unterschied machen. Indem sie den menschlichen Faktor im Rahmen der Datenanalyse reduziert, haben Datenteams mehr Zeit, sich auf andere Herausforderungen zu konzentrieren, anstatt die Daten langwierig für die weitere Nutzung vorzubereiten. Auf diese Weise können Unternehmen die Datenzugriffsströme verbessern und zeitnah eine einheitliche Sichtweise über verschiedene Standpunkte hinweg erhalten.
Auf die Datenqualität kommt es an
Wenn die Datenqualität als gut und zuverlässig eingestuft wird, kann automatisiertes maschinelles Lernen (AutoML) dazu beitragen, die Erkenntnisse zu beschleunigen und bestimmte Prozesse wie zu automatisieren, zum Beispiel intelligente manuelle Prozesse wie etwa die Datenextraktion aus PDFs, das Labeling oder die Klassifizierung. Diese Automatisierung beschleunigt nicht nur den Datenfluss, sondern spart Zeit und auch enorme Kosten für die beteiligten Teams.
AutoML hilft Nutzern, die keine Datenwissenschaftler sind, Machine Learning zu verwenden.
Bei den meisten ML-Plattformen handelt es sich um Black-Box-Modelle – es ist schwierig, die Modelle im Detail zu erklären. Das ist ein entscheidender Faktor für den Erfolg vieler ML-Projekte, da hier das entsprechende Know-how benötigt wird. Eine der Herausforderungen für die Nutzer besteht darin, die Statistiken oder die zugrunde liegende Logik zu verstehen.
AutoML ist ein Verfahren zur Automatisierung einiger der sich am häufigsten wiederholenden und zeitaufwändigen Aufgaben des maschinellen Lernens (ML). Es hilft Nutzern, die keine Datenwissenschaftler sind, Machine Learning zu verwenden. Die genaue Logik hinter ML zu kennen, ist daher nicht mehr notwendig. Das Verständnis der Auswirkungen aufs Business sowie der Relevanz der Ergebnisse ist jedoch ein entscheidender Benefit.
Der nächste Schritt zur datengetriebenen Kultur
Letztlich können das Verständnis und die Nutzung des vollen Potenzials von KI/ML bei der Datenanalyse den Unterschied zwischen einem datengesteuerten Unternehmen und einem, das mittelfristig hinter der Konkurrenz zurückbleibt, ausmachen. Automatisierung ist der Schlüssel zu einer robusten Datenstrategie, die Self-Service-Datenanalysetools, flexible Datenflüsse und Zugriffsdesigns umfasst. In dem Maße, in dem CDOs und Datenverantwortliche in den Unternehmen KI/ML in vollem Umfang nutzen, kann eine größere Anzahl einzelner Teams innerhalb einer Organisation zur Datenreise beitragen. Auf diese Weise schaffen Unternehmen eine datengetriebene Kultur, die so viele anstreben, aber noch lange nicht erreicht haben.
Hochentwickelte Data Analytics Lösungen stellen Tools, Frameworks und Integrationen bereit, die die Anwendung von AutoML vereinfachen. Nutzer können so AutoML-Experimente nahtlos aus der Datenbank selbst ausführen. Auf diese Weise wird die aufwändige Bereitstellung von Modellen und Prediction-Infrastruktur eliminiert und ML-Prozesse können so einen Schritt näher an die Daten herangebracht werden.