Wie halten Sie es mit der Datenhygiene?

April 14, 2021

data hygiene

Hygiene ist in Corona-Zeiten ein großes und wichtiges Thema und ähnlich sollte es um die Datenhygiene in Unternehmen bestellt sein. Immer noch kümmern sich viele Firmen nicht oder zu wenig um ein Datenqualitätsmanagement. Händewaschen, Desinfizieren, Mund-Nasen-Schutz tragen. In der physischen Welt haben wir Hygieneregeln verinnerlicht, so dass sie nahezu automatisch ablaufen. Doch wie sieht es eigentlich in der digitalen Welt aus? Kennen wir im Berufsalltag Datenhygieneregeln und wenden sie auch an?

Datenhygiene im Kundenmanagementsystem

Stellen Sie sich z.B. die Adressdaten in Ihrem CRM vor. Wie viele Kundendaten sind dort doppelt vorhanden? In verschiedener Schreibweise? Mit verschiedenen Ansprechpartnern? Mit unterschiedlichen Telefonnummern oder Postadressen? Warum das so ist, wissen Sie selbst am besten: unterschiedlichste Mitarbeiter:innen benutzen das Tool auf ihre je eigene Arbeitsweise, machen Schreibfehler, vergessen die eine oder andere Eintragung, verwechseln Zeileneinträge, und, und, und. Führen Sie die Liste der alltäglichen Fehler beliebig weiter. Vielleicht fragen Sie sich, ob ein paar unabsichtlich falsch eingetragene Kundendaten wirklich problematisch sind. Ja, das sind sie und zwar dann, wenn Sie Systeme integrieren wollen, also z.B. CRM und E-Mail-Client, denn bei zunehmendem Datenvolumen wird Datenqualität für Unternehmen wichtiger: Die erfolgreiche Integration von ERP-, BI-, BPM- oder CRM-Systemen hängt auch von verlässlichen und konsistenten Daten ab. Nicht zu vernachlässigen sind auch die unnötigen oder gar kritischen Kosten, die falsche Angaben verursachen. Diese können von einer fehlgeleiteten Marketing-Aktion (z.B. Kundenadresse existiert nicht mehr) bis zu falschen strategischen Entscheidungen (z.B. Prozessoptimierung aufgrund falscher Daten) reichen.

Datenhygiene beim E-Mail-Versand und in Dokumenten

E-Mail-Versand ist nach wie vor der häufigste Weg, auf dem elektronische Dokumente in Unternehmen transportiert werden. Neben den Daten die sichtbar in E-Mails verschickt werden, enthalten diese Nachrichten auch Metadaten und verborgene Informationen. Wird die E-Mail um einen Dokumenten-Anhang ergänzt kommen – neben dem Inhalt – weitere Metadaten hinzu. Zu den sogenannten Metadaten gehören z.B. Titel, Verfasser oder Thema, aber auch – in bearbeiteten Dokumenten – Versionsverwaltung, Änderungsverfolgung, Kommentarfunktion, verwendete Software, Erstellungs-, Änderungs- und Druckdatum. Ergänzend lassen sich auch – ohne ihr Wissen – Dateipfade, Druckerpfade, E-Mail-Adressen oder Benutzernamen in Metadaten dort finden. Grundsätzlich sind diese Daten praktisch beim Zuordnen und Verwalten. Die Informationen, die sich daraus extrahieren lassen, eignen sich jedoch auch für Manipulationen, wie z.B. Social Engineering. Lassen sich aus Ihren Dateipfaden Schlüsse auf Ihre Netzwerkstrukturen ziehen, besucht Sie demnächst evtl. ein freundlicher Trojaner. Software-Hersteller bieten Ihnen u.a. Funktionen an, mit denen Sie „verborgene Dateien“ entfernen können. Allerdings: Wie wahrscheinlich ist es, dass Ihre Mitarbeiter:innen diese Funktion kennen oder gar regelmäßig nutzen? Meine Hypothese: Die Wahrscheinlichkeit liegt bei < 1%.

Datenhygiene beim Speichern von Daten

Das täglich anfallende Datenvolumen in Unternehmen steigt – sei es die schnell abgelegte Datei auf dem Desktop, ein USB-Stick mit sensiblen Informationen, das geteilte Schriftstück in der Cloud – und wird zunehmend auch zum IT-Sicherheitsrisiko.

Bereits 2019 ergab eine Studie des Unternehmens Kaspersky, dass rund 69% der deutschen Büromitarbeiter:innen ihre Dokumente mit persönlich identifizierbaren und sensiblen Daten ablegten. Zwei Drittel (66 Prozent) der Befragten sahen sich nicht in der Verantwortung Dokumente sicher und konsistent zu managen und zu verwalten, sondern verließen sich auf die IT-Abteilung oder das Führungspersonal. Oftmals ist es immer noch so, dass in Unternehmen kein oder nur ein rudimentär strukturierter Rahmen für die Datenordnung mit klarer Dateibenennung existiert. Dies wirkt sich nicht nur hemmend auf den Workflow aus, sondern verstärkt das Datenchaos, insbesondere wenn Unternehmen wachsen.

“Da das Datenvolumen exponentiell zunimmt, sollten Geschäftsverantwortliche verstärkt auf Ordnerwüsten und das dadurch entstehende potenzielle Sicherheitsrisiko achten“, rät Maxim Frolov vom Kaspersky Lab.

Fehler minimieren – Datenqualität und -hygiene steigern

Um Fehler in den oben genannten Geschäftsprozessen zu reduzieren, gibt es ganz grundsätzlich folgende Möglichkeiten:

  • dafür sorgen, dass fehlerhafte Eingabe oder Ablage unwahrscheinlicher wird: d.h. eine Software zu wählen, die so einfach wie möglich für den Großteil aller Mitarbeitenden zu bedienen ist
  • ein verbindliches Rahmenwerk als Standard zur Dateneingabe, -weitergabe und -speicherung zu entwickeln (idealerweise gemeinsam in Teams)
  • regelmäßige Anwendungsschulungen für alle Mitarbeiter:innen – nur wer übt, lernt langfristig; ein einmaliges Aushändigen von Betriebshandbüchern/On-Boarding-Booklets kann nur der erste Schritt von vielen sein

Tipps für die Praxis

Für die tägliche Hygiene-Praxis halten die Expert:innen von Kopano verschiedene Tipps bereit:

“Datenhygiene bedeutet auch Ressourcenschonung, d.h. das Reduzieren von unnötigen Daten. Strukturierter Umgang mit seinen E-Mails kann heißen, dass man Unterordner in der Inbox nutzt oder man kann es sich zur Routine machen, jede E-Mail nur max. zweimal anzufassen (Matrix: dringend/wichtig/weniger, dringend/weniger wichtig). Das macht das Abarbeiten schneller und es geht nichts verloren.” (Anke Pawla, Partner Manager at Kopano)

“Versionen eines Dokuments sich manchmal wichtig, daher ist die Auswahl des richtigen Tools für die Datenhygiene umso wichtiger. Kopano ist mit Sync & Share-Lösungen integriert – wir nutzen diese Integration auch um Verschwendung von Daten zu vermeiden. Genauso sinnvoll ist es, Daten anderer Applikationen (z.B. CRM, ERP) intelligent zu integrieren, statt sie doppelt zu speichern. Und natürlich sollte man auch die „gelöschten Objekte“ nicht endlos wachsen lassen.” (Andreas Rösler, CEO at Kopano)

Datenhygiene und Digitalisierung

Sie stecken mitten im Digitalisierungsprozess und denken, dass die vorgenannten Punkte Sie nicht mehr treffen, da eine KI demnächst Ihre Prozesse intelligent optimiert? Weit gefehlt. Eine Studie des Massachusetts Institute of Technology (MIT) zeigt, dass die zehn am häufigsten verwendeten KI-Datensätze durch fehlerhafte Testdaten verfälscht sind.

“Dabei handelt es sich um Datensätze, die zur automatisierten Erkennung visueller, sprachlicher und auditiver Signale verwendet werden. Diese Fehler verzerrten die Vorstellung davon, wie weit die Technologie künstlicher Intelligenz tatsächlich fortgeschritten sei, wie die Wissenschaftsjournalistin Karen Hao in einem Artikel für die Technology Review schreibt.”

(Quelle: newsletter join-ada.com ; https://www.technologyreview.com/2021/04/01/)

Die o.g. Datensätze bilden die Grundlage für die KI-Forschung und sind daher besonders ernüchternd. Für die Studie nutzten die Wissenschaftler:innen selbst KI und überprüften die Datensätze per Machine Learning auf Richtigkeit. Sobald die KI-Erkennung vom ursprünglichen Datensatz abwich, wurde dieser von Menschen überprüft. Die korrigierten Datensätze waren letztlich besser als „weitaus komplexere Datenmodelle, die z.B. von Google verwendet werden und als allgemeiner Indikator für den Stand der Technologie gelten“.

Die Studie zeigt, wie wichtig Datenhygiene bzw. saubere Datensätze sind. Ohne effektive Datenhygiene schreiben sich Fehler in Algorithmen für KI-Anwendungen ein und verursachen nicht nur falsche Entscheidungen, sondern können auch zu diskriminierenden Ergebnissen führen. Dies wiederum kann die digitale Souveränität beeinträchtigen. Aber das ist ein anderes Thema für einen der nächsten Blogbeiträge.