ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics

2015 veröffentlichte IBM eine Überarbeitung und Erweiterung von CRISP-DM (CRoss-Industry Standard Process for Data Mining). Der neue Standard nennt sich ASUM-DM, in Langform: Analytics Solutions Unified Method for Data Mining/Predictive Analytics.

ASUM-DM: Versionen und Ziele

Von ASUM-DM gibt es zwei Versionen: eine freie, im Internet erhältliche, sowie eine proprietäre, die für den IBM-internen Gebrauch vorgesehen ist.

Aufgabe und Ziel der Entwicklung war es, Schwachstellen des deutlich älteren (ab 1996 entwickelten) CRISP-DM-Standards zu überwinden. Dazu wurden neue und verbesserte Templates, Vorgaben und Maßnahmen aufgenommen.

Durch Anwendung des Standard-Modells kann man in vorhandenen Daten Zusammenhänge und Muster aufdecken und diese gegebenenfalls auf neue Daten anwenden, um Vorhersagen zu erstellen.

ASUM-DM: Phasen

ASUM; Quelle: IBM

Im ASUM-Prozess werden fünf Phasen unterschieden, die jedoch nicht immer streng chronologisch, sondern je nach Anwendungsfall auch mehrfach durchlaufen werden:

  1. Analyse (Analyze)
  2. Design
  3. Konfiguration und Herstellung (Configure & Build)
  4. Inbetriebnahme (Deploy)
  5. Betrieb und Optimierung (Operate and Optimize)

Die Phasen werden jeweils von einem Projekt-Management-Stream begleitet und kontrolliert.

Wichtig ist zu Beginn, dass alle Beteiligten sich über Anforderungen und Ziele abstimmen und einigen. Anschließend werden Komponenten der Lösung bestimmt sowie Ressourcen und die Entwicklungsumgebung geklärt (2 Design). Dann werden die Komponenten schrittweise umgesetzt und getestet (3), bevor sie in die Produktivumgebung integriert werden (4). In der folgenden Anwendung sind kontinuierliche Optimierungen (5) wichtig, um Schwächen zu überwinden.

ASUM-DM: Weiterführende Links

3 Gedanken zu „ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics“

  1. Hallo,

    ich freue mich über diesen Beitrag. Hier wird offensichtlich das klassische Projektmanagement mit den Anforderungen an eine Datenanalyse gemischt. Generell stimme ich dem Vorgehen zum Projektmanagement im klassischen Sinne zu.
    Ich bin jedoch der Meinung, dass auf die zwei grundlegenden Schritte des CRISP-DM nicht verzichtet werden sollte. Das Geschäftsverständnis, als auch das Datenverständnis für den jeweiligen Geschäftsnutzen darf nicht ausgelassen werden. Dies hat meiner Meinung nach Auswirkungen auf die Projektdauer, da wiederholt iterativ die Anforderungen überarbeitet werden müssen. Betrachtet man das magische Dreieck hat dies dann auch Auswirkungen auf die Kosten.

    Ich freue mich über weitere Kommentare zu diesem Thema.

    Viele Grüße
    Antje Gerritzma

    1. Danke, guter Hinweis! Denke auch, dass es in der Praxis nicht linear funktioniert und dass der Kontext (Geschäftsverständnis, Datenverständnis) eine wichtige Rolle spielt.

Freue mich über Kommentare!