SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?

Der SPSS Modeler, die High-End-Statistik-Lösung von IBM SPSS, wartet mit einem vielversprechenden Knoten für die Datenvorbereitung auf: der Automatischen Datenvorbereitung (ADP, Automatic Data Preparation). Datenvorbereitung ist oft der zeitaufwändigste Arbeitsschritt Wer sich schon mal intensiver mit Datenauswertung oder data mining beschäftigt hat, hat sehr wahrscheinlich die Erfahrung gemacht, dass die Datenvorbereitung oft der zeitintensivste Arbeitsschritt … „SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?“ weiterlesen

Datenaufbereitung für abhängige Stichproben: long- und wide-Format

Angenommen, es liegen Daten in folgendem Format vor: ID Messzeitpunkt Messwert 1 1 7 1 2 10 2 1 4 2 2 3 … Nun soll überprüft werden, ob die Daten des ersten Messzeitpunkts sich signifikant vom zweiten Messzeitpunkt unterscheiden. Ganz einfach, könnte man meinen: t-Test, Testvariable=Messwert, Gruppe=Messzeitpunkt (Gruppe 1 = Zeitpunkt 1, Gruppe 2 … „Datenaufbereitung für abhängige Stichproben: long- und wide-Format“ weiterlesen

CRISP-DM: Ein Standard-Prozess-Modell für Data Mining

CRISP-DM steht für CRoss-Industry Standard Process for Data Mining. Dieses branchenübergreifende Prozess-Modell wurde ab 1996 im Rahmen eines EU-Förderprojekts entwickelt, und zwar von so namhaften Teilnehmern wie DaimlerChrysler (damals noch Daimler-Benz) und SPSS (damals ISL). Es ist nicht eigentumsrechtlich geschützt. Es werden sechs Phasen in Data Mining-Projekten unterschieden, wobei man sich diese Phasen nicht als … „CRISP-DM: Ein Standard-Prozess-Modell für Data Mining“ weiterlesen