Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

 

CRISP-DM, der Cross Industry Standard Process for Data Mining, ist der branchenübergreifende Standard zur Umsetzung datengetriebender Projekte. CRISP-DM bietet Unternehmen eine bewährte Methode, um Daten systematisch zu analysieren und daraus wertvolle Erkenntnisse zu gewinnen.

 

Ob Big Data, klassische Business Intelligence oder Machine Learning - der CRISP-DM-Prozess stellt sicher, dass Ihre Analyseprojekte strukturiert, nachvollziehbar und zielgerichtet verlaufen.

 

Auf dieser Seite geben wir Ihnen einen Überblick über die Phasen des CRISP-DM-Prozesses und wie Sie ihn erfolgreich in Ihrem Unternehmen anwenden können. Außerdem stellen wir Ihnen die Chancen, Herausforderungen und einige Best Practices vor.

 

Darüber hinaus haben Sie die Möglichkeit, von unserer Expertise zu profitieren, indem wir Ihnen ein kostenloses Strategiegespräch anbieten, um Ihre individuellen Datenanalysebedürfnisse zu besprechen.

 

 

Inhalt

 

Was ist CRISP-DM?

 

Das CRISP-DM-Modell wurde 1996 von NCR, SPSS Inc. und DaimlerChrysler entwickelt und ist seitdem der De-facto-Standard im Data Mining. Es ist unabhängig von Branche, Software oder Unternehmensgröße einsetzbar und bietet eine klare Struktur für den gesamten Datenanalyseprozess. Im Jahr 2000 wurde mit dem CRISP-DM-Modell ein einheitlicher Prozessstandard für Data Mining geschaffen.

 

Ziele des CRISP-DM-Modells

 

  • Bereitstellung eines einheitlichen Prozessmodells für Data-Mining-Projekte
  • Branchenübergreifende Anwendbarkeit
  • Unterstützung bei der Umsetzung von Big-Data-Projekten
  • Integration in Tools wie IBM SPSS Modeler

 

Als Ergebnis der kontinuierlichen und tiefgreifenden Entwicklung auf dem Gebiet des Data Mining haben sie mit dem CRISP-DM-Modell einen einheitlichen Standard geschaffen. Dazu gehören NCR System Engineering, SPSS Inc. und die DaimlerChrysler AG. Kernziel des CRISP-DM-Modells ist es, Unternehmen einen standardisierten Data-Mining-Prozess zur Verfügung zu stellen, der branchen-, software- und anwendungsunabhängig ist. Kurzer Überblick über die Ziele des Data Mining Vorgehensmodells:

 

  • Schaffung eines einheitlichen Prozess- und Programmmodells für Data-Mining-Projekte
  • Weite Verbreitung in verschiedenen Industrien
  • Data Mining Leitfaden und Projekt in 6 Schritten

 

 

phasen crips dm 2

Die 6 Phasen des CRISP-DM Modells

 

1. Geschäftsverständnis

 

In der ersten Phase geht es darum, das übergeordnete Geschäftsproblem zu verstehen. Die Ziele aus Unternehmenssicht werden präzise formuliert - denn nur mit einem klar definierten Zweck ist ein erfolgreiches Datenanalyse-Projekt möglich. In diesem ersten Schritt müssen die grundlegenden Probleme und Fragen des Projekts geklärt werden.

  • Welche Fragestellung soll gelöst werden?
  • Wie lautet die genaue Zielsetzung?
  • Wie laufen die zugrundeliegenden Geschäftsprozesse ab?

 

Hier werden hauptsächlich Informationen über die Geschäftssituation des KundenIdentifizierung von personelle und materielle Ressourcen, die genutzt werden könnten, gesammelt. Diese Phase ist besonders entscheidend für die Ausrichtung des Gesamten CRISP-DM-Prozesses.

 

 

2. Datenverständnis

 

Welche Daten stehen zur Verfügung? Welche Datenquellen sind relevant? In dieser Phase werden die vorhandenen Daten gesammelt, explorativ untersucht und erste Hypothesen entwickelt. Ziel ist es, ein tiefes Verständnis für Struktur, Inhalt und Qualität der Daten zu erlangen - Datenqualität spielt hierbei oft eine zentrale Rolle.

 

Diese Phase kann in die folgenden Schritte unterteilt werden:

 

  • Daten sammeln: In dieser Phase werden die für die Analyse benötigten Daten beschafft und ggf. in bestehende Datensätze integriert. Probleme bei der Datenbeschaffung sollten vom Analysten immer dokumentiert werden, um mögliche Diskrepanzen in einem späteren Folgeprojekt zu vermeiden.

 

  • Daten beschreiben: In diesem Schritt geht es darum, ein allgemeines Verständnis der Daten zu erlangen. Des Weiteren werden die Eigenschaften der Daten beschrieben, wie z.B. die Datenmenge, die Formateigenschaften, die Anzahl der Datensätze und Felder sowie die Eigenschaften der Felder. Die entscheidende Frage, die sich der Analytiker stellen sollte, ist, ob die verfügbaren Daten für die Datenanalyse ausreichen, um das Projekt erfolgreich abzuschließen.

 

  • Untersuchung der Daten: Bei der Datenanalyse werden erste Analysen mit den Daten durchgeführt, um z.B. bestimmte Produktgruppen zu identifizieren, die einen großen Teil des Umsatzes ausmachen. Dazu werden Berichte erstellt, um erste Erkenntnisse und Hypothesen zu visualisieren.

 

  • Auswertung der Daten: Anschließend werden die Daten ausgewertet. Es soll festgestellt werden, ob die Datenmenge für die Analyse ausreichend und brauchbar ist. Besonderes Augenmerk ist auf fehlende Attributwerte zu legen.

 

 

3. Datenaufbereitung

 

Die Daten werden transformiert, bereinigt und in ein geeignetes Format gebracht - oftmals der aufwendigste Schritt im CRISP-DM-Ansatz. Ziel ist es, eine saubere, homogene Datenbasis für die Modellierung zu schaffen.

 

In der dritten Phase von CRISP-DM werden die für die Analyse relevanten Daten ausgewählt.

 

  • Datenauswahl: Die Auswahl der Daten für das Data Mining hängt stark von den Zielen ab, die für das Data Mining-Projekt festgelegt wurden. Dabei spielen die Datenqualität und die technischen Gegebenheiten eine wichtige Rolle. Am Ende dieses Prozesses sollte geklärt werden, welche Datensätze von der Analyse ausgeschlossen werden.

 

  • Datenbereinigung: Ohne Datenbereinigung ist ein erfolgreiches Datenverarbeitungsprojekt fraglich. Um die gewünschten Ergebnisse im Modell zu erhalten, sollte ein sauberer Datensatz ausgewählt oder der Datensatz bereinigt werden.

 

  • Datentransformation und -integration: Daten werden in ein Darstellungsformat umgewandelt, das zur Gewinnung von Informationen verwendet werden kann. Die Transformation organisiert die Daten und verändert ihre Details durch Gruppierung oder Sortierung. Es können Basiszahlen für Analysen erzeugt werden, z.B. Umsatz pro Kunde, Umsatzanteil pro Kunde oder prozentualer Umsatz in Produktgruppen pro Kunde etc.

 

  • Datenform: In einigen Fällen muss nur die Datenform geändert werden, um das Modell zu erstellen, z.B. muss der Datentyp geändert werden.

 

 

4. Modellierung

 

Basierend auf der definierten Fragestellung und den aufbereiteten Daten werden verschiedene Modelle entwickelt und getestet. Die Auswahl reicht von Entscheidungsbäumen bis zu neuronalen Netzen - je nach Ziel und Datenlage. Der Hauptteil dieser Phase besteht darin, verschiedene Modelle zu entwickeln und zu testen, um das beste Modell zu finden.

  • Es muss ein geeignetes Modell ausgewählt werden, mit dem das jeweilige Projekt am besten abgebildet werden kann.

  • Ein Testmodell wird erstellt, um die Genauigkeit und Qualität zu testen. Als Maß für die Qualität wird üblicherweise die auftretende Fehlerrate verwendet.

  • Es wird bewertet, ob das Modell die zu Beginn des Projektes festgelegten Ziele erfüllt. Darüber hinaus sind betriebswirtschaftliche Fragen zu bewerten.

 

 

5. Bewertung

 

Die gewählten Modelle werden kritisch geprüft: Entsprechen sie den geschäftlichen Zielen? Wie zuverlässig ist die Prognose? Die Bewertung umfasst sowohl statistische Kennzahlen als auch fachliche Validierung. Diese Phase dient der Qualitätssicherung im gesamten CRISP-DM-Prozess.

 

  • Interpretation und Bewertung der Ergebnisse: In dieser Phase muss überprüft werden, ob und inwieweit die Projektziele erreicht wurden. Wenn die Ziele nicht erreicht wurden, muss dokumentiert werden, was geschehen ist.

 

  • Verfeinerung und Verbesserung des Modells: Nach der ersten Test- und Auswertungsphase können Anpassungen oder Änderungen vorgenommen werden. In einigen Fällen kann es auch ratsam sein, Projektattribute hinzuzufügen oder zu entfernen.

 

  • Schließlich muss der Projektleiter entscheiden, ob das vorliegende Projekt abgeschlossen und implementiert werden soll oder ob weitere Anpassungen erforderlich sind.

 

 

6. Bereitstellung

 

In der letzten Phase erfolgt die Integration der Ergebnisse in die Unternehmensprozesse - etwa durch automatisierte Reports, Dashboards oder operative Systeme. Auch Schulungen und Dokumentation sind Teil der Bereitstellung.

 

  • Integration des Modells in die Produktionsumgebung

  • Benutzer- und Bedienerschulung durchführen

  • Überwachung und Wartung des Modells

Chancen und Herausforderungen des Modells

 

Chancen

 

  • Struktur: Durch standardisierte Prozesse und Aktivitäten gibt es eine klare Struktur und eine gemeinsame Terminologie für Data Mining Projekte.
  • Flexibilität: Der Prozess ist flexibel genug, um auf eine Vielzahl von Geschäftsproblemen und Datenquellen angewendet zu werden.
  • Iterativ: Der iterative Charakter des Prozesses ermöglicht die Modifikation und Verbesserung des Prozesses basierend auf dem Feedback aus früheren Schritten.
  • Transparenz: Der Prozess fördert Transparenz und Offenheit im Projektmanagement und erleichtert die Kommunikation zwischen verschiedenen Parteien.

 

Herausforderungen

 

  • Datenqualität: Die Qualität der Daten ist ein kritischer Faktor für den Erfolg von CRISP-DM. Wenn die Daten nicht vollständig, korrekt oder aktuell sind, können die Ergebnisse des Modellierungsprozesses beeinträchtigt werden.
  • Interpretation der Ergebnisse: Die Interpretation der Ergebnisse des Data Mining-Prozesses kann eine Herausforderung darstellen, insbesondere wenn komplexe Algorithmen zur Analyse und Modellierung der Daten verwendet werden.
  • Komplexität: Der CRISP-DM-Prozess ist komplex und erfordert viel Zeit und Ressourcen, um alle Phasen abzuschließen. Dies kann für einige Unternehmen oder Organisationen eine Herausforderung darstellen, insbesondere wenn es an Fachwissen oder Budget mangelt.

 

Ihr Ansprechpartner

 

Meinert Jacobsen, Diplom-Statistiker, wird Ihnen als Berater zur Seite stehen und Sie tatkräftig bei der Umsetzung und Implementierung des CRISP-DM Modells umfassend unterstützen.

 

Seit über 30 Jahren ist er in der Datenanalyse und Statistik tätig. Nach mehreren Stationen in großen internationalen Unternehmen ist er seit 2006 alleiniger Gesellschafter der marancon GmbH und seit 2016 Gründer der B2B Smart Data GmbH. 2024 fusionierten beide Schwesterfirmen zu datavance GmbH.

 

Darüber hinaus ist er als Dozent an der TuCed Chemnitz (seit 2014) sowie seit dem Jahr 2020 an der adg Montabaur und seit dem Jahr 2021 am International Management College tätig.

 

Jetzt Kontakt aufnehmen!

 

Referenz

 

 

Webinar Aufzeichnung, CRISP DM, Digitales Marketing, Datenanalyse

Webinar: Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

Vom Chaos zur Erkenntnis: Mit CRISP DM Ordnung in Ihre Daten bringen:
Datenanalysen sind heutzutage unverzichtbar, um erfolgreich am Markt agieren zu können. Doch wie kann man sicherstellen, dass eine Datenanalyse auch tatsächlich zum gewünschten Erfolg führt? Hier kommt der Industriestandard CRISP DM ins Spiel. Mit CRISP DM hat sich ein bewährtes Modell etabliert, das Unternehmen dabei unterstützt, ihre Datenanalyseprojekte erfolgreich umzusetzen.

In unserem Webinar zeigen wir Ihnen, wie Sie mit CRISP DM Schritt für Schritt durch den Datenanalyseprozess geführt werden und so eine Erfolgsgarantie für Ihre Datenanalysen erhalten. Verpassen Sie nicht diese Chance, um wertvolle Einblicke in eine der wichtigsten Methoden der Datenanalyse zu gewinnen!

 

Jetzt kostenfrei ansehen

Expertentalks

 

Tauchen Sie ein in die Welt der Expertentalks von datavance. Erfahren Sie aus erster Hand von führenden Experten der Branche, wie Sie datengetriebenes Marketing und Künstliche Intelligenz optimal für Ihr B2B-Unternehmen einsetzen können. Lassen Sie sich inspirieren, tauschen Sie sich aus und entdecken Sie neue Perspektiven für Ihren Erfolg.

Wir bieten Ihnen nicht nur klassische Expertentalks, sondern auch Podcasts, Vodcasts, Diskussionsrunden und vieles mehr! Hier finden Sie einen Überblick von Podcasts und Expertentalks, welche von Mitarbeitender der datavance mitgestaltet und durch Vorträge unterstützt wurden.

 

Jetzt Expertentalks anhören

FAQs

 

 

Gibt es bestimmte Voraussetzungen für CRISP-DM (bspw. Ein CRM)?

 

Nein, es gibt keine Voraussetzungen. Es gibt Kunden, die nicht über ein CRM-System verfügen und dieses auch nicht benötigen und trotzdem Analysen durchführen. Die Analyseprozesse können unabhängig von den Kundenprozessen durchgeführt werden. 

 

 

Welche Vorbereitungen müssen vor dem Projekt intern getroffen werden?

 

Es sind keine Vorbereitungen erforderlich. Wichtig ist nur, dass die richtigen Ansprechpartner gefunden werden und, dass diese auch Zeit für den Workshop haben und anwesend sind. Die Rahmenbedingungen werden im Rahmen des Projektes als erstes abgefragt und können dann in der Folge entsprechend umgesetzt werden.

 

 

Welche Personen müssen im CRISP-DM-Prozess beteiligt sein?

 

Wichtig sind die Fachabteilung, die Datenanalysten und diejenigen, die das Ganze hinterher anwenden müssen. Das ist zum Beispiel auch die IT. Idealerweise gehört auch die Geschäftsführung dazu, wenn sie im Projekt involviert ist und dahintersteht. Es macht auch Sinn, die Datenschutzbeauftragten und Rechtsabteilung am Anfang einzubinden.

 

 

Wie lange dauert das Projekt ungefähr?

 

Der erste Workshop dauert einen Tag. Dann folgt nach 2-3 Tagen die Dokumentation, aus der die nächsten Schritte abgeleitet werden. Es gibt Projekte, die 2 Wochen dauern, aber auch Projekte, die 5 Monate dauern. Die Dauer hängt immer davon ab, was am Ende umgesetzt wird und wie das Engagement ist. Das kann von einer Woche bis zu mehreren Jahren dauern. Aber in diesem Fall gibt es mehrere Prozesse, die parallel laufen.

 

 

Wie geht es nach dem Projekt weiter?

 

Nach dem Projekt ist vor dem Projekt. Das Deployment und die fertige Analyse sind abgeschlossen. Hier folgen meistens die nächsten Fragestellungen, die dann dementsprechend gelöst werden.

 

Kontakt

 

 

Sie möchten das CRISP-DM-Modell in Ihrem Unternehmen einsetzen oder Ihre bestehende Strategie analysieren lassen? Dann freuen wir uns auf Ihre Nachricht.

 

 

Jetzt kostenloses Strategiegespräch führen!