Frag die Daten – Datenanalyse entdeckt die natürliche Sprache

Dank Firmen wie Qlik oder Tableau ist Datenanalyse wesentlich zugänglicher für den „normalen Nutzer“ geworden. Jetzt können Fragen in natürlicher Sprache in ein Suchfeld eingegeben werden – und fertig ist das Chart. 

IBMs Watson hat es vorgemacht: Statt über die komplexe Benutzeroberfläche einer Datenanalyse-Software mühsam die richtigen Tabellen in Relation zu bringen und darüber Grafiken zu bauen, spricht der Nutzer eine Frage wie „Wie hoch war die durchschnittliche Gewinnmarge bei Produkt X im ersten Halbjahr 2017 in der Region Südbayern?“ ins Mikrofon und bekommt über den Lautsprecher eine Antwort. Traumhaft einfach in der Benutzung, aber höchst aufwändig in der Bereitstellung. Denn dahinter steckt eine der fortgeschrittensten Engines für Künstliche Intelligenz, gepaart mit Fähigkeiten der natürlichen Spracherkennung und einer Menge Vorarbeit in Sachen Datenaufbereitung. 

Obwohl kaum sieben Jahre alt, hat es ThoughtSpot in den Quadranten der ‚Leader‘ geschafft – dank natürlicher Sprachverarbeitung. (Quelle: Gartner)

Produkte wie Watson werden so schnell nicht zum Mainstream der Datenanalyse gehören, dennoch zeigen sie, wohin langfristig die Reise hingeht. Künstliche Intelligenz hält nach und nach Einzug in die Datenanalyse und führende Unternehmen in diesem Bereich wie SAS präsentieren sich schon jetzt eher als KI-Firmen denn als Analytics-Anbieter. 

Es wird noch eine Weile dauern

Hersteller wie Tableau, MicrosoftQlikund auch IBMs Analytics-Sparte Cognos versuchen es mit einer einfacheren Version der KI. Die Analyse-Tools von Tableau und Microsoft bieten seit einiger Zeit die Möglichkeit, Datenabfragen in Form von Fragen in natürlicher Sprache einzugeben. Qlik hat Anfang dieses Jahres das Startup Crunch Data übernommen, dessen CrunchBot nun in eine Schnittstelle für natürliche Sprache in Qlik Sense bietet. 

Das US-Startup ThoughtSpot hatte diese Art der Interaktion zwischen Mensch und Analytics-Software von Beginn an im Auge – und noch einiges mehr. „Genau wie bei den Suchvorschlägen von Google kann die Maschine Vorschläge anbieten und diese in Echtzeit verfeinern, um genau die Frage zu beantworten, die der Benutzer im Sinn hat“, sagt dessen Product Marketing Director, Anand Raghavan. 

Zugleich könnten die Algorithmen, die diese Abfragen ausführen, aus den menschlichen Interaktionen lernen und mit der Zeit den Nutzer besser „verstehen“. Der Algorithmus könne sich dadurch auf die verschiedenen  Arten von Abfragen und die verschiedenen Benutzerpersönlichkeiten einstellen und schneller bessere Ergebnisse liefern. Das alles scheint so auch einigermaßen zu funktionieren, denn das kaum sieben Jahre alte Startup wird in Gartners Magic Quadrant als „Leader“ eingestuft. 

Tableau-Nutzer „fragen die Daten“

Bei der ‚Frag die Daten‘-Funktion von Tableau braucht der iterative Lernprozess des Algorithmus noch etwas mehr Aktivität und Arbeit seitens des Nutzers. Die Funktion beruht auf einem Parser, der die Intention hinter mehrdeutigen sprachlichen Formulierungen wie „letztes Jahr“, „beliebteste“ oder „früheste“ verarbeiten kann. In Kombination mit dem gespeicherten Wissen über die Datenquelle und früheren Benutzeraktivitäten schätzt die Funktion ein, worauf die Frage abzielt, und liefert auf dieser Grundlage ihre Ergebnisse.

Wird beispielsweise eine Frage eingegeben wie „Welchen Kunden gewähren wir den höchsten Rabatt?“, antwortet die Software mit einer interaktiven Visualisierung. Anschließend kann der Nutzer die Ergebnisse mit weiteren Fragen verfeinern, direkt mit der Visualisierung interagieren oder zur Drag-&-Drop-Oberfläche von Tableau wechseln, um die Daten genauer unter die Lupe zu nehmen. 

Die Tableau-Funktion mit einer interaktiven Visualisierung, die mit weiteren Fragen verfeinert werden kann. (Foto: Tableau)
Die Tableau-Funktion mit einer interaktiven Visualisierung, die mit weiteren Fragen verfeinert werden kann. (Foto: Tableau)

IBM Cognos lässt Daten erkunden

Bei IBM Cognos ist der Dialog mit dem System in der Funktion „Exploration“ (Erkundung) untergebracht. Darin wendet sich der Nutzer zunächst an einen Assistenten und gibt im Klartext die Art der Daten bzw. Parameter an, die er sehen möchte (siehe Video unten). Das System präsentiert daraufhin eine Reihe von Datentabellen, aus denen der Nutzer die relevanten wählen kann. Anschließend kann er ebenfalls im Klartext die Art von Grafik angeben (z.B. Umsatz nach Produktart) und die Software bietet eine Reihe von Visualisierungen an, aus welchen der Nutzer wählen kann.

YouTube

Diese Seite nutzt einen YouTube-Kanal, der Google Ireland Ltd. gehört. Angaben darüber, welche Daten durch Google verarbeitet und zu welchen Zwecken genutzt werden, finden Sie in der Datenschutzerklärung von Google

Video laden

Microsoft Power BI erlaubt Folgefragen

Auf einem ähnlichen Niveau bewegt sich die ‚Q&A‘-Funktion von Microsoft Power BI, die nun dahingehend erweitert wurde, dass man als Nutzer seine Frage mit Folgefragen verfeinern kann. Follow-up-Fragen lassen sich nahtlos und ebenso in natürlicher Sprache stellen, ohne die ursprüngliche Frage zu verändern. Lautet zum Beispiel die ursprüngliche Frage: „Wie viele Kunden haben in München grüne Produkte gekauft?“, können mit Schlüsselwörtern wie „Was ist mit“, „anstatt“ oder „auch“ die Ergebnisse präzisiert oder Parameter geändert werden. In unserem Beispiel könnte die Nachfolgefrage z.B. lauten „Was ist mit roten Produkten?“ oder „Was ist mit Nürnberg?“ oder „Und wie war das 2017?“. 

Bei Power BI können mit Schlüsselwörtern wie "Was ist mit", "anstatt" oder "auch" die Ergebnisse präzisiert oder Parameter geändert werden. (Foto: Microsoft)
Bei Power BI können mit Schlüsselwörtern wie „Was ist mit“, „anstatt“ oder „auch“ die Ergebnisse präzisiert oder Parameter geändert werden. (Foto: Microsoft)

Microsoft weist darauf hin, dass die verschiedenen Datentabellen zuvor in Beziehung zueinander gestellt werden müssen, damit Q&A richtig funktioniert. Zudem sollten die in der Frage benutzten Parameter und Einheiten möglichst genau auch der in der Datenbasis verwendeten Terminologie entsprechen. „Q&A kann einfache Wortanalysen durchführen und Pluralformen erkennen, es wird aber davon ausgegangen, dass die Tabellen- und Spaltennamen den Inhalt genau bezeichnen“, heißt es im Advisory.

Das könnte Sie auch interessieren

Back to top button