An diesen 5 Kriterien erkennen Sie vertrauenswürdige Daten

Die Notwendigkeit zuverlässiger Daten wurde besonders während der Corona-Krise evident. Die Beurteilung der Datenqualität sollte deshalb systematisch nach definierten Kriterien erfolgen, das gefühlte Vertrauen allein reicht nicht.

„Mithilfe zuverlässiger Daten können Unternehmen schnelle und fundierte Entscheidungen treffen.“ Diese inzwischen zur Binsenweisheit mutierte Floskel hat während der Corona-Krise ihrer Feuertaufe bestanden. Und an Daten mangelt es nicht, im Gegenteil. So rechneten die Analysten von IDC schon im Jahr 2019 damit, dass sich das Datenvolumen weltweit von 41 Zettabyte innerhalb von sechs Jahren auf 175 Zettabyte mehr als vervierfachen wird. 

Das Datenvolumen wird sich innerhalb von sechs Jahren mehr als vervierfachen, (Quelle: IDC)
Das Datenvolumen wird sich innerhalb von sechs Jahren mehr als vervierfachen, (Quelle: IDC)

Ob die steigenden Datenmengen un den nächsten Jahren zu einer Herausforderung werden oder einem Vermögenswert, hängt von den Unternehmen selbst ab. Denn die Daten, die heute in allen Abteilungen in großen Mengen generiert werden, ermöglichen Managern bessere Einblicke in ihr Unternehmen: Wo kommen die Zutaten oder Einzelteile der eigenen Produkte her, wie lange dauert die Produktion oder die Entwicklung neuer Produkte, wer sind die Käufer und wie lassen sich neue Zielgruppen erschließen? 

Daten machen agil

Dass Firmen die Bedeutung ihrer Daten erkannt haben, zeigt eine Analyse des ITK-Branchenverbands Bitkom zum Thema Datennutzung in der deutschen Wirtschaft. Hierbei gaben 85 Prozent der Unternehmen mit 50 Mitarbeitern und mehr an, dass Daten für sie eine große Bedeutung haben. Während der Corona-Krise hat sich zudem gezeigt, dass Organisationen, die anhand vertrauenswürdiger Daten schnell Entscheidungen treffen können, sich agil an Veränderungen anpassen können, um beispielsweise bei unterbrochenen Lieferketten schnell neue Partner zu finden.

Da immer mehr Organisationen ihre digitale Transformation vorantreiben, neue Technologien entstehen und deren Nachfrage bei Verbrauchern steigt, werden die Datenmengen in Zukunft weiter wachsen. Für Unternehmen bedeutet dies, dass sie ihr Datenmanagement optimieren müssen, um einerseits die Menge der Daten zu beherrschen und andererseits vertrauenswürdige Daten zu schaffen. So können Manager sich auf die eigentliche Entscheidungsfindung konzentrieren, statt die Qualität ihrer Daten zu diskutieren.

Die fünf Kriterien vertrauenswürdiger Daten

Wie aber können Unternehmen sicherstellen, dass ihre Daten zuverlässig und für ihre Zwecke geeignet sind? Dafür müssen die Datensätze vollständig, aktuell, nachvollziehbar, transparent und überprüfbar sein. Nur wenn alle fünf Aspekte erfüllt werden, können Unternehmen ihren Daten tatsächlich vertrauen. Was es mit diesen Kriterien auf sich hat, zeigen die folgenden Absätze.

1Vollständigkeit

Um aussagekräftige Erkenntnisse zu erhalten, dürfen Unternehmen Daten nicht isoliert betrachten. Wenn ein Datensatz vollständig ist, also keine Duplikate enthält und Daten aus der gesamten Organisation beinhaltet, erhalten Mitarbeiter einen ganzheitlichen Überblick. Ein Beispiel hierfür ist die Mortalitätsrate von COVID-19: Nur für sich betrachtet, liefert die Angabe der Fälle pro Land keine vertrauenswürdige Sichtweise. Erst durch die Ergänzung durch weitere Daten, wie der Anzahl der Einwohner der jeweiligen Länder, lassen sich sinnvolle Schlussfolgerungen ziehen.

2Aktualität

Organisationen sollten darauf achten, dass sie Entscheidungen anhand aktueller Daten treffen. Dienen Daten erst Wochen oder Monate, nachdem sie abgerufen wurden, als Entscheidungsgrundlage, können sie bereits veraltet sein und die Umstände sich entscheidend geändert haben. Vor allem in der derzeit unsicheren Situation ist die Aktualität von Daten wichtiger denn je und Unternehmen müssen Entscheidungen in Echtzeit fällen.

3Nachvollziehbarkeit

Damit Daten vertrauenswürdig sind, ist es wichtig, dass ihre Quellen nachvollziehbar sind. Datenintegrität wird erreicht, indem Unternehmen in ihren Datensätzen klar kennzeichnen, woher die Daten stammen, wie sie sich verändert haben und wer für sie verantwortlich ist. Dieser Faktor wird noch zu selten berücksichtigt, obwohl er für die Vertrauenswürdigkeit von Daten eine große Bedeutung hat.

4Transparenz

Je weiter die Entwicklung innovativer Technologien wie Machine Learning und Künstliche Intelligenz voranschreitet, desto wichtiger werden transparente Daten. Menschen müssen verstehen können, wie und warum Maschinen Entscheidungen treffen, und diese Prozesse erklären können. Der Black-Box-Ansatz verringert jedoch das Vertrauen in die Anwendungen und die daraus entstehenden Daten.

5Überprüfbarkeit

Für Unternehmen ist es außerdem wesentlich, ihre Daten zu überprüfen, um sicherzustellen, dass diese optimiert, fehlerfrei und erklärbar sind. Die Entwicklung selbstfahrender Autos ist ein gutes Beispiel dafür, warum es wichtig ist, die zu Grunde liegende Ursache einer Entscheidung zu verstehen. So müssen Entwickler nach einem Unfall den konkreten Auslöser, also die falsche Entscheidung des Autos, herausfinden, um die Situation zu verstehen und eine Wiederholung verhindern zu können. Daher müssen die Daten, auf denen diese Entscheidung basierte, vollständig rückverfolgbar sein.

Technologien vereinfachen den Prozess

Für Unternehmen, die bisher nur wenige Ressourcen in das Management ihrer Daten gesteckt haben, kann das Erfüllen dieser fünf Anforderungen zunächst sehr komplex, aufwändig und kostspielig erscheinen. Jedoch sind bereits heute Technologien verfügbar, die Organisationen dabei helfen, eine hohe Integrität und Vertrauenswürdigkeit ihrer Daten zu erreichen, indem sie Prozesse vereinfachen, optimieren und automatisieren.

Datenhaltung in der Cloud macht Daten allgemein verfügbar und verhindert unnötiges Duplizieren.

Für ein effizientes Datenmanagement sollten Unternehmen zudem in Betracht ziehen, ihre Daten in der Cloud zu speichern. Dies bietet Mitarbeitern mehr Flexibilität beim Datenzugriff. Damit wird es beispielsweise möglich, auch per Browser aus dem Homeoffice heraus selbst größte Datensätze zu bearbeiten. Zudem wird dadurch die Wahrscheinlichkeit verringert, dass die gleichen Daten immer wieder an verschiedenen Orten gespeichert werden und Duplikate entstehen. 

Zusätzlich bieten Cloud-Backup-Lösungen den Vorteil, dass die Unternehmensdaten bei versehentlicher Löschung oder nach einem externen Angriff schnell wiederhergestellt werden können. Mithilfe von Lösungen für das Suchen, Indexieren und Katalogisieren lassen sich Daten außerdem dokumentieren, einschließlich der Informationen, aus welcher Abteilung sie stammen, wer für sie verantwortlich ist, wie sie verändert wurden und welche Art von Daten sie sind. Dies ermöglicht einen vollständigen Überblick über den gesamten Datenlebenszyklus. KI-gestützte Anwendungen wiederum können die Inhalte der Daten auslesen und so mögliche Qualitäts- oder Compliance-Probleme erkennen und beheben. Durch den Einsatz solcher Technologien verbessern Unternehmen die Integrität ihrer Daten, um nachvollziehbare und fundierte Geschäftsentscheidungen zu treffen.

Fazit

Organisationen haben zwar das Potenzial ihrer Daten erkannt, jedoch nutzen nur wenige geeignete Lösungen für das Datenmanagement. Unternehmen wie Talend helfen dabei, Daten schnell, sicher und kosteneffizient zu verarbeiten – auch unter Einsatz von Cloud-Ressourcen. Denn erst mit einer zentralen Plattform für das Datenmanagement gelingt es, das Potenzial von Daten zu nutzen, um damit die eigene Marktposition auszubauen.


Über den Autor

Über den Autor

Jan Wetzke ist Regional Vice President, Central and Eastern Europe beim Anbieter von Tools fürs Daten-Qualitätsmanagement Talend.

 

Das könnte Sie auch interessieren

Was meinen Sie dazu?

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Back to top button