ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics

2015 veröffentlichte IBM eine Überarbeitung und Erweiterung von CRISP-DM (CRoss-Industry Standard Process for Data Mining). Der neue Standard nennt sich ASUM-DM, in Langform: Analytics Solutions Unified Method for Data Mining/Predictive Analytics. ASUM-DM: Versionen und Ziele Von ASUM-DM gibt es zwei Versionen: eine freie, im Internet erhältliche, sowie eine proprietäre, die für den IBM-internen Gebrauch vorgesehen ist. Aufgabe und Ziel … „ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics“ weiterlesen

Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden

Beim Data Mining geht es darum, Erkenntnisse aus vorhandenen Daten zu gewinnen – im Gegensatz zum Machine Learning, das darauf abzielt, zuvor traininerte Modelle auf neue Daten anzuwenden. TL; DR: Kurze Zusammenfassung Entscheidungsbäume sind ein mächtiges Werkzeug für Data Mining-Aufgaben. Sind sind in R leicht zu erstellen und besonders gut präsentierbar, wenn sie in interaktiven … „Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden“ weiterlesen

Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

SPSS Modeler: Merkmalsauswahl (Feature Selection)

In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen

Datenanalysten halfen Obama zur „Titelverteidigung“

Obamas Wiederwahl hatte laut einem TIME-Artikel viel mit einer ausgefeilten data mining-Strategie zu tun. Die entsprechenden Spezialisten werden darin als backroom number crunchers („Zahlenakrobaten im Hinterzimmer“) bezeichnet. So beruhte zum Beispiel der „Abendessen mit Barack Obama“-Wettbewerb auf ausgiebigen Analysen. Als Prominente wurde Sarah Jessica Parker ausgewählt. Ein Ziel bestand darin, genau die Gruppe von Menschen zu … „Datenanalysten halfen Obama zur „Titelverteidigung““ weiterlesen

Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration“

Einige Stichpunkte zu aktuellen Trends und Herausforderungen der Marktforschung speziell im Kontext der Online-Befragungen: Befragungen werden zunehmend auf mobilen Endgeräten durchgeführt; Zahl der Befragten, die per Smartphone oder Tablet auf CAWI-Seiten (Computer Assisted Web Interviewing) zugreifen, hat sich von 2011 auf 2012 vervierfacht; aktueller Anteil mobiler Endgeräte an den Befragungen von Lightspeed Research: 5% technische … „Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration““ weiterlesen

Titanic, Untergang, SPD, Weltkulturerbe und Dresden …

2012 markiert den hundertsten Jahrestag des Titanic-Untergangs. Einige Zahlen: ca. 1.500 Tote beim Untergang am 15.4.1912, ca. 700 Überlebende April 2012: Eröffnung eines Titanic-Zentrums für 97 Mio. Pfund in Belfast/Irland; dort war das Schiff einst gebaut worden Versteigerung der Speisekarte mit dem letzten Mittagsmenü auf dem Schiff für 76.000 Pfund (rund 91.000 Euro) Titanic-Film (1997): … „Titanic, Untergang, SPD, Weltkulturerbe und Dresden …“ weiterlesen

CRISP-DM: Ein Standard-Prozess-Modell für Data Mining

CRISP-DM steht für CRoss-Industry Standard Process for Data Mining. Dieses branchenübergreifende Prozess-Modell wurde ab 1996 im Rahmen eines EU-Förderprojekts entwickelt, und zwar von so namhaften Teilnehmern wie DaimlerChrysler (damals noch Daimler-Benz) und SPSS (damals ISL). Es ist nicht eigentumsrechtlich geschützt. Update: Der neuere Standard heißt ASUM-DM (Analytics Solutions Unified Method for Data Mining/Predictive Analytics). Es … „CRISP-DM: Ein Standard-Prozess-Modell für Data Mining“ weiterlesen