Mehr Daten als Sandkörner: Warum Dark Data die dunkle Seite der Business Analytics ist

„Dark Data“ – das klingt unheimlich, wenn nicht fast schon gefährlich. Und in der Tat, die „dunklen Daten“, also der verborgene Teil der anfallenden Datenmassen, birgt durchaus Risiken für Unternehmen. Dabei besteht die größte Gefahr darin, dass Datenmassen unkontrolliert bleiben. Was steckt also hinter diesen dunklen Daten?

Von Gastautor Sascha Grosskopf, Senior B2B Marketing and Demand Gen Expert bei Cornerstone OnDemand

Weltweit wächst die Menge der gespeicherten und der über das Internet transportiert Daten rapide an. Nach Studien des IDC-Instituts wird die Menge anfallender Daten weltweit von rund 8,6 Zettabyte im Jahr 2015 auf rund 40 Zettabyte im Jahr 2020 anwachsen. In der aktuellen Dekade 2010 bis 2020 wird danach die Datenmasse auf das 50-fache ansteigen. Damit wird es schließlich 57-mal mehr Daten als Sandkörner auf den Stränden dieser Erde geben.

Die Entwicklungen der betriebsinternen Unternehmenssuchmaschinen bietet zwar viele Vorteile und wird auf lange Sicht in größere Organisationen Einzug halten müssen, dennoch gibt es bis heute immer noch Daten, die nur schwer zu evaluieren sind. Hier spricht man von Dark Data. Im Grunde lassen sich nach dem Databerg-Report von Veritas Technolgies Daten in drei verschiedene Kategorien einteilen:

1. Geschäftskritische Daten:

Hierbei handelt es sich um Daten, die einfach offenkundig wichtig für den Betrieb und Unternehmenserfolg sind. Sie stellen dabei – entgegen der weit verbreiteten Meinung – nicht den Großteil des Datenvolumens dar, werden aber am meisten genutzt, da sie sich leicht erheben und messen lassen. Die Daten werden gleichzeitig proaktiv geschützt und in Echtzeit von Mitarbeitern analysiert. Allerdings sind sie mit einem Anteil von 15 Prozent an der Gesamtdatenmenge vergleichsweise überschaubar.

2. ROT-Daten:

ROT oder anders ausgedrückt „Redundant, Obsolet, Trivial“ stellen Daten ohne Geschäftswert dar und sollten daher in Abständen gelöscht werden. Hierzu zählen vor allem Spam, Werbung oder Phishing-Mails. Sie entsprechen ungefähr 19 Prozent in Deutschland, der europäische Schnitt liegt bei 32 Prozent.

3. Dark Data:

Bei Dark Data handelt es sich um grundsätzlich ungenutzte Daten, die in den Untiefen der Speicherplattformen schlummern. Ihre Nutzbarkeit und damit ihr Wert ist noch nicht identifiziert. Eine aktive Zuordnung zu geschäftskritischen oder ROT-Daten ist aber aus wirtschaftlichen Gründen notwendig.

Dark Data für betriebliche Zwecke

Dark Data sind betriebliche Informationen, die an unterschiedlichsten Stellen und Geräten anfallen. Sie werden entweder gar nicht oder nicht ausreichend betrieblich zielführend ausgewertet. Nehmen wir als Beispiel Log-Dateien von Servern. Sie werden in aller Regel angelegt und gespeichert um im Fall der Fälle Fehler des Servers analysieren und beheben zu können. Gleichzeitig werden sie auch eingesetzt, um die Wirksamkeit von Sicherheitsmaßnahmen prüfen zu können – also nachträglich zu prüfen, ob jemand Sicherheitsmaßnahmen austricksen konnte und unbefugt auf Daten zugegriffen hat.

Diese dunklen Daten ließen sich aber auch für weitere betriebliche Zwecke auswerten. Unternehmen könnten zum Beispiel die Inhalte und Services ihrer Webseite auf Grundlage dieser Daten optimieren, wozu in der Praxis regelmäßig jedoch zusätzliche Tools eingesetzt werden, die unabhängig von den vorhandenen Daten eigene Datensilos anlegen und nutzen. Unabhängig von der wirtschaftlich effizientesten Nutzung von Daten müssen Unternehmen natürlich auch Risiken dieser Daten erkennen und minimieren. Dabei müssen diese Datenmassen zuerst vor unbefugtem Zugriff geschützt werden.

Die tatsächliche Nutzung und Auswertung dieser Daten

Wenn die Daten sich auf Personen beziehen, also beispielsweise Mitarbeiter oder Kunden, ist über das eigene unternehmerische Risiko, auch das Risiko für diese Personen zu kontrollieren. Das heißt schon die Speicherung dieser Art von Daten sollte mit den entsprechenden Experten, wie dem Datenschutzbeauftragten, besprochen sein. Die tatsächliche Nutzung und Auswertung dieser Daten sollte ebenfalls in enger Abstimmung mit dem Datenschutz und auch mit den Mitbestimmungsgremien erfolgen. Denn unter Umständen führen die angefallenen Daten zu Informationen über Social Skills wie Teamfähigkeit oder kommunikative Kompetenzen von Mitarbeitern. Das Management wird durch die Einbindung der Stakeholder in der Lage sein, eine ausgewogene data driven HR-Strategie zu entwickeln, die sich auf die effiziente Nutzung der notwendigen Daten beschränkt.

Dunkle Daten bergen auch Gefahren für Unternehmen

Unternehmen aus Deutschland schneiden vor allem im Kostenvergleich zu den USA schlecht ab. Demnach wendet ein heimisches Unternehmen pro 1.000 Terabyte an Daten jährlich 594.000 Euro auf, um triviale Daten zu verarbeiten, die irrelevant für das Geschäft sind. Langsam wird den Organisationen dieser Umstand aber bewusst, jedoch fehlt es häufig noch an einer ganzheitlichen Systemlösung. Die möglichst effiziente Arbeit mit den anfallenden Daten gilt im Bereich Big Data zurzeit als eines der dringlichsten Themen. Die Kernfrage: Wie lassen sich Dark Data kategorisieren und nutzbar machen? Wie können Daten genutzt und dabei das Vertrauen der Mitarbeiter in einen respektvollen Umgang bestätigt werden?

Licht ins Dunkel bringen

Schließlich sind Daten keine Highscores, die man wie in einem alten Arcade-Videospiel sammelt und am Ende eine Medaille erhält. Daten sollen einen Wert besitzen und vor allem Mehrwert schaffen. Denn Dark Data, die als Vorratsdaten umherschwirren wie Meteoriten durchs Weltall, laufen Gefahr, schädlich für das Unternehmen zu werden. Denn einige der Daten könnten brisante Informationen über die Organisation enthalten oder sogar gegen bestehende Compliance-Regeln verstoßen. Der Dieselgate-Skandal hat der ganzen Welt demonstriert, wie zu viel Unwissenheit über die eigenen Daten sogar einen Konzern ins Wanken bringen können.

Bisher haben die IT-Strategien auf zusätzliche Ressourcen wie Speichervolumen gesetzt, die immer schneller verarbeitet werden konnten. Es scheint an der Zeit den Wert als Abwägung zwischen Nutzen und Risiko der anfallenden Daten in den Vordergrund zu rücken. Das Management muss daher verstärkt auf Lösungen wie Enterprise Search setzen und flexible Information-Governance-Strategien entwickeln, um die dunklen Daten transparent und messbar zu machen.

Zum Autor: Sascha Grosskopf unterstützt seit April 2014 das Marketing und Demand Generation Team in EMEA bei Cornerstone OnDemand und arbeitet vom Düsseldorfer Büro aus. Grosskopf verfügt über umfassende Branchenkenntnis und detailliertes Wissen in den Bereichen Talent Management, Change Management und Unternehmensentwicklung. Vor seinem Eintritt bei Cornerstone arbeitete Grosskopf für Lumesse und war dort als Leiter des europäischen Marketings zuständig.