ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics

2015 veröffentlichte IBM eine Überarbeitung und Erweiterung von CRISP-DM (CRoss-Industry Standard Process for Data Mining). Der neue Standard nennt sich ASUM-DM, in Langform: Analytics Solutions Unified Method for Data Mining/Predictive Analytics.

ASUM-DM: Versionen und Ziele

Von ASUM-DM gibt es zwei Versionen: eine freie, im Internet erhältliche, sowie eine proprietäre, die für den IBM-internen Gebrauch vorgesehen ist.

Aufgabe und Ziel der Entwicklung war es, Schwachstellen des deutlich älteren (ab 1996 entwickelten) CRISP-DM-Standards zu überwinden. Dazu wurden neue und verbesserte Templates, Vorgaben und Maßnahmen aufgenommen.

Durch Anwendung des Standard-Modells kann man in vorhandenen Daten Zusammenhänge und Muster aufdecken und diese gegebenenfalls auf neue Daten anwenden, um Vorhersagen zu erstellen.

ASUM-DM: Phasen

ASUM; Quelle: IBM

Im ASUM-Prozess werden fünf Phasen unterschieden, die jedoch nicht immer streng chronologisch, sondern je nach Anwendungsfall auch mehrfach durchlaufen werden:

  1. Analyse (Analyze)
  2. Design
  3. Konfiguration und Herstellung (Configure & Build)
  4. Inbetriebnahme (Deploy)
  5. Betrieb und Optimierung (Operate and Optimize)

Die Phasen werden jeweils von einem Projekt-Management-Stream begleitet und kontrolliert.

Wichtig ist zu Beginn, dass alle Beteiligten sich über Anforderungen und Ziele abstimmen und einigen. Anschließend werden Komponenten der Lösung bestimmt sowie Ressourcen und die Entwicklungsumgebung geklärt (2 Design). Dann werden die Komponenten schrittweise umgesetzt und getestet (3), bevor sie in die Produktivumgebung integriert werden (4). In der folgenden Anwendung sind kontinuierliche Optimierungen (5) wichtig, um Schwächen zu überwinden.

ASUM-DM: Weiterführende Links

Ein Gedanke zu „ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics“

Freue mich über Kommentare!