Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

 

CRISP-DM, der Cross Industry Standard Process for Data Mining, gilt als etablierter, branchenübergreifender Standard für die Umsetzung datengetriebener Projekte. Die CRISP-DM Methode unterstützt Unternehmen dabei, Daten strukturiert auszuwerten und daraus wertvolle Erkenntnisse abzuleiten.

 

Egal ob Big Data, klassische Business Intelligence oder Machine Learning - der CRISP-DM-Prozess sorgt für einen strukturierten, transparenten und zielorientierten Ablauf Ihrer Analyseprojekte.

 

Auf dieser Seite erhalten Sie einen kompakten Überblick über die einzelnen Phasen des CRISP DM Prozesses und erfahren, wie Sie ihn erfolgreich in Ihrem Unternehmen einsetzen.

 

 

 

Inhalt

 

Was ist CRISP-DM?

 

Das CRISP DM Modell wurde 1996 von NCR, SPSS Inc. und DaimlerChrysler entwickelt und hat sich seither als De facto Standard im Data Mining etabliert. Es ist branchenunabhängig, softwareunabhängig und für Unternehmen jeder Größe geeignet. Das Modell strukturiert den gesamten Datenanalyseprozess nachvollziehbar. Mit der Einführung des Modells im Jahr 2000 wurde erstmals ein einheitlicher Prozessstandard für Data Mining definiert.

 

 

Ziele des CRISP-DM-Modells

 

  • Bereitstellung eines einheitlichen Prozessmodells für Data-Mining-Projekte

 

  • Branchenübergreifende Anwendbarkeit

 

  • Unterstützung bei der Umsetzung von Big-Data-Projekten

 

  • Integration in Tools wie IBM SPSS Modeler

 

Vor dem Hintergrund der fortlaufenden Weiterentwicklung im Data Mining entwickelten NCR System Engineering, SPSS Inc. und die DaimlerChrysler AG mit CRISP DM einen einheitlichen Prozessstandard. Ziel des CRISP DM Modells ist es, Unternehmen einen standardisierten Data Mining Prozess bereitzustellen, der branchenunabhängig, softwareunabhängig und flexibel einsetzbar ist.

 

Die zentralen Ziele des Data Mining Vorgehensmodells im Überblick:

 

 

  • Schaffung eines einheitlichen Prozess- und Programmmodells für Data-Mining-Projekte

 

  • Weite Verbreitung in verschiedenen Industrien

 

  • Klare Gliederung des Data Mining Prozesses in aufeinander aufbauende Phasen

 

 

phasen crips dm 2

Die 6 Phasen des CRISP-DM Modells

 

 

1. Geschäftsverständnis

 

In der ersten Phase steht das Verständnis des übergeordneten Geschäftsproblems im Vordergrund. Die Ziele werden aus Unternehmenssicht klar definiert. Nur mit einem klar definierten Zweck ist ein erfolgreiches Datenanalyse-Projekt erst möglich. In diesem Schritt werden die zentralen Fragestellungen und Rahmenbedingungen des Projekts festgelegt:

 

  • Wie lautet die Fragestellung und wie soll sie gelöst werden?

 

  • Wie genau lautet die Zielsetzung?

 

  • Wie ist der Ablauf der grundlegenden Geschäftsprozesse?

 

In dieser Phase werden zentrale Informationen zur Geschäftssituation des Kunden erfasst und relevante personelle sowie materielle Ressourcen identifiziert. Diese Phase bildet die entscheidende Grundlage für die inhaltliche Ausrichtung des gesamten CRISP DM Prozesses.

 

 

 

2. Datenverständnis

 

Welche Daten stehen zur Verfügung? Welche Datenquellen sind relevant? In dieser Phase werden die Daten zusammengeführt, analysiert und erste Hypothesen abgeleitet. Ziel ist ein fundiertes Verständnis von Struktur, Inhalt und Qualität der Daten, wobei die Datenqualität eine zentrale Rolle spielt.

 

Diese Phase kann in die folgende Schritte unterteilt werden:

 

 

  • Daten sammeln: 

    In dieser Phase werden die für die Analyse erforderlichen Daten beschafft und bei Bedarf in bestehende Datensätze integriert. Herausforderungen bei der Datenbeschaffung sollten dabei stets dokumentiert werden, um mögliche Abweichungen in späteren Projekten nachvollziehbar zu machen.

 

  • Daten beschreiben: 

    In diesem Schritt wird ein grundlegendes Verständnis der vorliegenden Daten aufgebaut. Dazu gehört die Beschreibung zentraler Merkmale wie Datenumfang, Formate, Anzahl der Datensätze und Felder sowie deren Eigenschaften. Entscheidend ist die Bewertung, ob die verfügbaren Daten in Qualität und Umfang ausreichen, um die Analyseziele erfolgreich zu erreichen.

 

  • Untersuchung der Daten: 

    In der Datenanalyse werden erste Auswertungen durchgeführt, um relevante Muster zu erkennen, etwa Produktgruppen mit hohem Umsatzanteil. Zur Darstellung erster Erkenntnisse und zur Ableitung von Hypothesen werden entsprechende Berichte und Visualisierungen erstellt.

 

  • Auswertung der Daten: 

    Anschließend erfolgt die Auswertung der Daten mit dem Ziel zu prüfen, ob Umfang und Qualität für die Analyse ausreichend sind. Besonderes Augenmerk liegt dabei auf fehlenden Attributwerten und möglichen Lücken im Datenbestand.

 

 

 

3. Datenaufbereitung

 

Die Daten werden transformiert, bereinigt und in ein geeignetes Format umgewandelt. Dieser Abschnitt zählt häufig zu den aufwendigsten Phasen im CRISP DM Ansatz, da hier die Grundlage für eine saubere und homogene Datenbasis für die Modellierung entsteht.

 

In der dritten Phase von CRISP-DM werden die für die Analyse relevanten Daten ausgewählt.

 

 

  • Datenauswahl:

    Die Auswahl der für das Data Mining relevanten Daten orientiert sich an den definierten Projektzielen sowie an der verfügbaren Datenqualität und den technischen Rahmenbedingungen. Zum Abschluss dieses Schrittes wird festgelegt, welche Datensätze in die Analyse einbezogen und welche ausgeschlossen werden.

 

  • Datenbereinigung:

    Ohne eine konsequente Datenbereinigung ist der Erfolg eines Datenverarbeitungsprojekts fraglich. Um belastbare Modellergebnisse zu erzielen, muss ein geeigneter Datensatz ausgewählt oder der bestehende Datenbestand entsprechend bereinigt werden.

 

  • Datentransformation und -integration:

    Die Daten werden in ein Darstellungsformat überführt, das die Informationsgewinnung unterstützt. Durch Transformationen lassen sich Daten strukturieren und detaillieren, etwa durch Gruppierungen oder Sortierungen. Auf dieser Basis entstehen Kennzahlen für die Analyse, zum Beispiel Umsatz pro Kunde, Umsatzanteile oder prozentuale Umsätze je Produktgruppe.

 

  • Datenform:

    In manchen Fällen reicht es aus, die Datenform anzupassen, um ein Modell zu erstellen, etwa durch die Änderung von Datentypen.

 

 

 

4. Modellierung

 

Basierend auf der definierten Fragestellung und den aufbereiteten Daten entstehen verschiedene Modelle, die entwickelt und getestet werden. Je nach Zielsetzung und Datenlage kommen dabei Verfahren von Entscheidungsbäumen bis hin zu neuronalen Netzen zum Einsatz. Das Kernziel dieser Phase ist es, durch Das Entwickeln und Testen verschiedener Modelle zu entwickeln und das leistungsfähigste Modell zu identifizieren. 

 

 

  • Die Modellauswahl richtet sich darauf aus, das Projekt mit dem am besten geeigneten Modell abzubilden.

 

  • Ein Testmodell dient dazu, Genauigkeit und Qualität zu überprüfen. Als zentrales Qualitätsmaß kommt dabei in der Regel die Fehlerrate zum Einsatz.

 

  • Es wird bewertet, ob das Modell die zu Projektbeginn festgelegten Ziele erreicht. Zusätzlich fließen betriebswirtschaftliche Fragestellungen in die Beurteilung ein.

 

 

5. Bewertung

 

In dieser Phase erfolgt eine kritische Prüfung der ausgewählten Modelle: Entsprechen sie den geschäftlichen Zielen? Wie zuverlässig ist die Prognose? Die Bewertung berücksichtigt sowohl statistische Kennzahlen als auch die fachliche Validierung und dient der Qualitätssicherung im gesamten CRISP DM Prozess.

 

  • Interpretation und Bewertung der Ergebnisse: 

    In dieser Phase wird überprüft, ob und in welchem Umfang die Projektziele erreicht wurden. Werden Ziele verfehlt, werden die Ursachen nachvollziehbar dokumentiert.

 

  • Verfeinerung und Verbesserung des Modells: 

    Nach der ersten Test und Auswertungsphase lassen sich gezielte Anpassungen vornehmen. Dazu zählt bei Bedarf auch das Hinzufügen oder Entfernen einzelner Projektattribute.

 

 

Abschließend entscheidet die Projektleitung, ob das Projekt abgeschlossen und implementiert wird oder ob weitere Anpassungen erforderlich sind.

 

 

6. Bereitstellung

 

In der letzten Phase fließen die Ergebnisse in die Unternehmensprozesse ein, etwa über automatisierte Reports, Dashboards oder operative Systeme. Ergänzend gehören Schulungen und eine strukturierte Dokumentation zur Bereitstellung.

 

  • Integration des Modells in die Produktionsumgebung

 

  • Durchführung einer Benutzer- und Bedienerschulung

 

  • Überwachung und Wartung des Modells

Chancen und Herausforderungen des Modells

 

 

 

Chancen

 

  • Struktur: 

    Standardisierte Prozesse und Aktivitäten schaffen eine klare Struktur und eine einheitliche Terminologie für Data Mining Projekte.

     

  • Flexibilität:

    Der Prozess lässt sich flexibel auf unterschiedliche Geschäftsprobleme und Datenquellen anwenden.

 

  • Iterativ:

    Die iterative Beschaffenheit des Prozesses ermöglicht eine kontinuierliche Anpassung und Optimierung des Prozesses auf Basis der Erkenntnisse aus früheren Schritten.

 

  • Transparenz:

    Der Prozess schafft Transparenz und Offenheit im Projektmanagement und erleichtert die Kommunikation zwischen den beteiligten Parteien.

 

 

 

Herausforderungen

 

 

  • Datenqualität: 

    Die Datenqualität ist ein entscheidender Erfolgsfaktor im CRISP DM Prozess. Unvollständige, fehlerhafte oder veraltete Daten beeinträchtigen die Ergebnisse der Modellierung erheblich.

 

  • Interpretation der Ergebnisse: 

    Die Interpretation der Ergebnisse aus dem Data Mining Prozess stellt häufig eine Herausforderung dar, insbesondere beim Einsatz komplexer Analyse und Modellierungsverfahren.

 

  • Komplexität: 

    Der CRISP DM Prozess ist anspruchsvoll und erfordert Zeit sowie entsprechende Ressourcen, um alle Phasen vollständig umzusetzen. Für Unternehmen kann dies insbesondere dann zur Herausforderung werden, wenn Fachwissen oder Budget begrenzt sind.

 

Ihr Ansprechpartner

 

Meinert Jacobsen, Diplom-Statistiker, wird Ihnen als Berater zur Seite stehen und Sie tatkräftig bei der Umsetzung und Implementierung des CRISP-DM Modells umfassend unterstützen.

 

Seit über 30 Jahren ist er in der Datenanalyse und Statistik tätig. Nach mehreren Stationen in großen internationalen Unternehmen ist er seit 2006 alleiniger Gesellschafter der marancon GmbH und seit 2016 Gründer der B2B Smart Data GmbH. 2024 fusionierten beide Schwesterfirmen zu datavance GmbH.

 

Darüber hinaus ist er als Dozent an der TuCed Chemnitz (seit 2014) sowie seit dem Jahr 2020 an der adg Montabaur und seit dem Jahr 2021 am International Management College tätig.

 

Jetzt Kontakt aufnehmen!

 

E-Mail

LinkedIn

Kalender

 

Referenz

 

 

Webinar Aufzeichnung, CRISP DM, Digitales Marketing, Datenanalyse

Webinar: Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

 

Vom Chaos zur Erkenntnis: Mit CRISP DM Ordnung in Ihre Daten bringen:


Datenanalysen sind heutzutage unverzichtbar, um erfolgreich am Markt agieren zu können. Doch wie kann man sicherstellen, dass eine Datenanalyse auch tatsächlich zum gewünschten Erfolg führt? Hier kommt der Industriestandard CRISP DM ins Spiel. Mit CRISP DM hat sich ein bewährtes Modell etabliert, das Unternehmen dabei unterstützt, ihre Datenanalyseprojekte erfolgreich umzusetzen.

In unserem Webinar zeigen wir Ihnen, wie Sie mit CRISP DM Schritt für Schritt durch den Datenanalyseprozess geführt werden und so eine Erfolgsgarantie für Ihre Datenanalysen erhalten. Verpassen Sie nicht diese Chance, um wertvolle Einblicke in eine der wichtigsten Methoden der Datenanalyse zu gewinnen!

 

Jetzt kostenfrei ansehen

Expertentalks

 

Entdecken Sie die Expertentalks von datavance und erhalten Sie praxisnahe Einblicke von führenden Branchenexperten. Erfahren Sie, wie datengetriebenes Marketing und Künstliche Intelligenz im B2B gezielt eingesetzt werden können. Lassen Sie sich inspirieren, vertiefen Sie Ihr Wissen und entdecken Sie neue Perspektiven für Ihren unternehmerischen Erfolg.

 

Neben klassischen Expertentalks bieten wir auch Podcasts, Vodcasts, Diskussionsrunden und vieles mehr an! Hier finden Sie eine Übersicht über Podcasts und Expertentalks, dievon Mitarbeitenden der datavance mitgestaltet und durch Vorträge unterstützt wurden.

 

Jetzt Expertentalks anhören

FAQs

 

 

Gibt es bestimmte Voraussetzungen für CRISP-DM (bspw. Ein CRM)?

 

Nein, es gibt keine Voraussetzungen. Analysen lassen sich auch ohne vorhandenes CRM System durchführen, da nicht jedes Unternehmen ein solches System benötigt. Die Analyseprozesse erfolgen unabhängig von den bestehenden Kundenprozessen.

 

 

Welche Vorbereitungen müssen vor dem Projekt intern getroffen werden?

 

Es sind keine besonderen Vorbereitungen erforderlich. Entscheidend ist nur, dass die richtigen Ansprechpartner identifiziert werden und, dass diese auch Zeit für den Workshop haben und anwesend sind. Die notwendigen Rahmenbedingungen werden zu Projektbeginn erhoben und anschließend entsprechend umgesetzt.

 

 

Welche Personen müssen im CRISP-DM-Prozess beteiligt sein?

 

Wichtig sind die Fachabteilungen, die Datenanalysten sowie alle Personen, die die Ergebnisse hinterher operativ anwenden. Dazu zählt zum Beispiel auch die IT. Idealerweise ist auch die Geschäftsführung eingebunden, sofern sie im Projekt involviert ist und das Vorhaben unterstützt. Zusätzlich empfiehlt es sich, die Datenschutzbeauftragten und Rechtsabteilung frühzeitig in den Prozess einzubinden.

 

 

Wie lange dauert das Projekt ungefähr?

 

Der erste Workshop nimmt einen Tag in Anspruch. Nach 2-3 Tagen folgt dann die Dokumentation, aus der die nächsten Schritte abgeleitet werden. Die Projektdauer variiert stark. Es gibt Vorhaben mit einer Laufzeit von etwa zwei Wochen, ebenso wie Projekte, die sich über mehrere Monate erstrecken. Ausschlaggebend sind der Umfang der geplanten Umsetzung und das Engagement der Beteiligten. Das kann von einer Woche bis zu mehreren Jahren dauern. Aber in diesem Fall gibt es mehrere Prozesse, die parallel laufen.

 

 

Wie geht es nach dem Projekt weiter?

 

Nach dem Projekt ist vor dem Projekt. Das Deployment und die fertige Analyse sind abgeschlossen. Hier folgen meistens die nächsten Fragestellungen, die dann dementsprechend gelöst werden.

 

Kontakt

 

 

Sie möchten das CRISP-DM-Modell in Ihrem Unternehmen einsetzen oder Ihre bestehende Strategie analysieren lassen? Dann freuen wir uns auf Ihre Nachricht.

 

 

Jetzt kostenloses Strategiegespräch führen!