Wer regelmäßig mit Daten arbeitet, hat den Satz „Garbage in – grabage out!“ mit Sicherheit schon mehr als einmal gehört – oder auch selbst verwendet. Ursprünglich stammt die Aussage aus der Informatik und bezieht sich auf fehlerhafte Eingaben bzw. Codes, die zu einem unbrauchbaren Ergebnis führen.
Die Aussage "Garbage in - garbage out" wird jedoch seit langer Zeit nicht mehr nur von Informatikern sondern auch von Datenanalysten und Modellierern verwendet, um auf ein gravierendes Problem hinzuweisen: ohne eine ausreichende Datenqualität kann auch das schönste statistische Modell und die beste Analyse keine aussagekräftigen und zuverlässigen Ergebnisse liefern. Die Qualität des Inputs (Daten) bestimmt maßgeblich die Qualität des Outputs (Analyseergebnis) mit.
Welche Kriterien zur Überprüfung der Datenqualität herangezogen werden, variiert etwas. In der Regel werden 7 bis 11 Kriterien genutzt:
Oft werden auch noch die Kriterien
verwendet, um die Datenqualität zu beurteilen.
Oft gibt es in Unternehmen keine Person (die sogenannte Data Stewardess), die für Fragen der Datenqualität zuständig ist. Dann hängt die Überprüfung und Einhaltung der Datenqualität oft stark davon ab, wie groß das Interesse der datenerstellenden und -nutzenden Parteien an den Daten ist. Gerade wenn Daten wenig intensiv genutzt werden oder jeder Unternehmensbereich seine Daten separat erfasst und verarbeitet (zur Problematik von Datensilos haben wir hier einen Blogbeitrag verfasst), kann es häufig zu Problemen kommen.
Abhilfe kann ein klares Data Governance oder Data Management-Konzept oder die Berufung einer Data Stewardess, die über die Datenqualität wacht, schaffen.
Begonnen werden sollte auf dem Weg zu mehr Datenqualität jedoch in einem ersten Schritt mit der Identifizierung der existierenden Probleme sowie einer Priorisierung der notwendigen Maßnahmen zur Verbesserung der Datenqualität. Sie sind sich unsicher, wie sie dies alles umsetzen können? Kontaktieren Sie uns, gerne begleiten wir Sie auf Ihrem Weg zu einer höheren Datenqualität.