Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

SPSS Modeler: Merkmalsauswahl (Feature Selection)

In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen

Datenanalysten halfen Obama zur „Titelverteidigung“

Obamas Wiederwahl hatte laut einem TIME-Artikel viel mit einer ausgefeilten data mining-Strategie zu tun. Die entsprechenden Spezialisten werden darin als backroom number crunchers („Zahlenakrobaten im Hinterzimmer“) bezeichnet. So beruhte zum Beispiel der „Abendessen mit Barack Obama“-Wettbewerb auf ausgiebigen Analysen. Als Prominente wurde Sarah Jessica Parker ausgewählt. Ein Ziel bestand darin, genau die Gruppe von Menschen zu … „Datenanalysten halfen Obama zur „Titelverteidigung““ weiterlesen

Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration“

Einige Stichpunkte zu aktuellen Trends und Herausforderungen der Marktforschung speziell im Kontext der Online-Befragungen: Befragungen werden zunehmend auf mobilen Endgeräten durchgeführt; Zahl der Befragten, die per Smartphone oder Tablet auf CAWI-Seiten (Computer Assisted Web Interviewing) zugreifen, hat sich von 2011 auf 2012 vervierfacht; aktueller Anteil mobiler Endgeräte an den Befragungen von Lightspeed Research: 5% technische … „Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration““ weiterlesen

CRISP-DM: Ein Standard-Prozess-Modell für Data Mining

CRISP-DM steht für CRoss-Industry Standard Process for Data Mining. Dieses branchenübergreifende Prozess-Modell wurde ab 1996 im Rahmen eines EU-Förderprojekts entwickelt, und zwar von so namhaften Teilnehmern wie DaimlerChrysler (damals noch Daimler-Benz) und SPSS (damals ISL). Es ist nicht eigentumsrechtlich geschützt. Es werden sechs Phasen in Data Mining-Projekten unterschieden, wobei man sich diese Phasen nicht als … „CRISP-DM: Ein Standard-Prozess-Modell für Data Mining“ weiterlesen