In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen
Schlagwort: Algorithmus
SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?
Der SPSS Modeler, die High-End-Statistik-Lösung von IBM SPSS, wartet mit einem vielversprechenden Knoten für die Datenvorbereitung auf: der Automatischen Datenvorbereitung (ADP, Automatic Data Preparation). Datenvorbereitung ist oft der zeitaufwändigste Arbeitsschritt Wer sich schon mal intensiver mit Datenauswertung oder data mining beschäftigt hat, hat sehr wahrscheinlich die Erfahrung gemacht, dass die Datenvorbereitung oft der zeitintensivste Arbeitsschritt … „SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?“ weiterlesen
Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration“
Einige Stichpunkte zu aktuellen Trends und Herausforderungen der Marktforschung speziell im Kontext der Online-Befragungen: Befragungen werden zunehmend auf mobilen Endgeräten durchgeführt; Zahl der Befragten, die per Smartphone oder Tablet auf CAWI-Seiten (Computer Assisted Web Interviewing) zugreifen, hat sich von 2011 auf 2012 vervierfacht; aktueller Anteil mobiler Endgeräte an den Befragungen von Lightspeed Research: 5% technische … „Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration““ weiterlesen
SPSS Modeler: Maschinenlernen vs. Statistische Modelle
Statistische Modelle beruhen auf mathematische Gleichungen, wobei ein Algorithmus die vorgegebenen Parameter schätzt. Moderner und flexibler sind Techniken zum Maschinenlernen. Sie werden auf Basis minimaler Anforderungen an die Modellstruktur und minimalen Annahmen für das Modell berechnet. Die Form der Beziehungen wird während des Lernprozesses bestimmt. Beispiel: Lineare Regression vs. Neuronales Netzwerk (Neural Network) Falls sich … „SPSS Modeler: Maschinenlernen vs. Statistische Modelle“ weiterlesen