Obamas Wiederwahl hatte laut einem TIME-Artikel viel mit einer ausgefeilten data mining-Strategie zu tun. Die entsprechenden Spezialisten werden darin als backroom number crunchers („Zahlenakrobaten im Hinterzimmer“) bezeichnet. So beruhte zum Beispiel der „Abendessen mit Barack Obama“-Wettbewerb auf ausgiebigen Analysen. Als Prominente wurde Sarah Jessica Parker ausgewählt. Ein Ziel bestand darin, genau die Gruppe von Menschen zu … „Datenanalysten halfen Obama zur „Titelverteidigung““ weiterlesen
Kategorie: Praxisbeispiel
Beispiele aus dem Forschungsalltag
SPSS Modeler Premium 15: Was ist neu?
IBM SPSS Modeler Premium enthält alles, was SPSS Modeler Professional (früher: Clementine) kann, sowie zusätzlich Text Mining. Neu sind zwei Zusatzpakete: Entity analytics Im Zeitalter von Big Data, den großen Datenmengen, besteht eine zentrale Herausforderung darin, Daten aus recht unterschiedlichen Quellen zu verbinden. Üblicher Weise funktioniert dies nur mit einem gemeinsamen Schlüssel – der jedoch … „SPSS Modeler Premium 15: Was ist neu?“ weiterlesen
Benutzerdefinierte Tabellen in SPSS: Beschriftungen variieren
Im heutigen Artikel möchte ich Möglichkeiten aufzeigen, wie man mit SPSS Beschriftungen in benutzerdefinierten Tabellen variieren kann. Erstes Beispiel: Unterbefehl SLABLES Angenommen, wir haben eine Variable Q4, die darüber Auskunft gibt, wie oft im Jahr ein Hundebesitzer mit Hund verreist. Wir möchten Minimum, Maximum, Mittelwert, Standardabweichung und die Fallzahl ermitteln, und zwar aufgeschlüsselt nach Geschlecht, … „Benutzerdefinierte Tabellen in SPSS: Beschriftungen variieren“ weiterlesen
Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration“
Einige Stichpunkte zu aktuellen Trends und Herausforderungen der Marktforschung speziell im Kontext der Online-Befragungen: Befragungen werden zunehmend auf mobilen Endgeräten durchgeführt; Zahl der Befragten, die per Smartphone oder Tablet auf CAWI-Seiten (Computer Assisted Web Interviewing) zugreifen, hat sich von 2011 auf 2012 vervierfacht; aktueller Anteil mobiler Endgeräte an den Befragungen von Lightspeed Research: 5% technische … „Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration““ weiterlesen
Rat der Deutschen Markt- und Sozialforschung e.V. rügt Dresdner Marktforschungsunternehmen
Nun hat es ein Dresdner Marktforschungsunternehmen erwischt: eine öffentliche Rüge, ausgesprochen vom Rat der Deutschen Markt- und Sozialforschung. Schade, dass es dazu kommen musste. Nach meiner Wahrnehmung ist Dresden bei überregionalen Branchenmeldungen weitgehend ein „weißer Fleck auf der Landkarte“. (Eine Ausnahme bildete der 44. Kongress der Deutschen Marktforschung im Mai 2009 in Dresden.) Und dann … „Rat der Deutschen Markt- und Sozialforschung e.V. rügt Dresdner Marktforschungsunternehmen“ weiterlesen
SPSS 21 ist da – was ist neu?
Was hat das neue IBM SPSS Statistics 21 zu bieten? Sicherheit: Passwortschutz für Daten und Ausgaben Beschleunigung: besonders bei großen Tabellen Verbesserungen: Datenmanagement – Vergleichen von Datensets vereinfachtes Zusammenführen von Dateien bessere Pivot-Tabellen erweiterte Client/Server-Technologie (Administration, Skalierbarkeit, Stabilität) Java Plugin Integration mit IBM Cognos (Datenimport aus Cognos Business Intelligence) Monte-Carlo-Simulationen Dieser Beitrag ist ein Update … „SPSS 21 ist da – was ist neu?“ weiterlesen
Wie ermittelt man Konfidenzintervalle für kategoriale Variablen in Stata?
Es gibt einen einfachen Stata-Befehl, mit dem man Konfidenzintervalle abrufen kann: ci Variable Der Haken daran: Der Befehl ist für metrische Variablen gedacht. Was tun, wenn man ein Konfidenzintervall für einen relativen Anteil ermitteln möchte? Beispiel: Marktanteil einer Kaffeemarke. Nehmen wir an, die Kaffeemarke AA kommt auf einen Marktanteil von 21,7%. Hier hilft ein einfacher … „Wie ermittelt man Konfidenzintervalle für kategoriale Variablen in Stata?“ weiterlesen
Soziologische Anmerkung zum „Fall Lance Armstrong“
Nachdem Lance Armstrong sich dem Gerichtsverfahren zu den Doping-Vorwürfen entzogen hat, wird viel über den tiefen Fall des siebenmaligen Tour de France-Siegers geschrieben. Dazu eine kurze Anmerkung aus soziologischer Perspektive. Abweichungen von gesellschaftlichen Normen (z. B. „Du sollst nicht dopen“) werden in der Soziologie mit Begriffen wie Anomie und abweichendem Verhalten beschrieben. Der Anomie-Begriff wurde … „Soziologische Anmerkung zum „Fall Lance Armstrong““ weiterlesen
Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?
Das Konfidenzintervall ist ein Vertrauensbereich: mit der angegebenen Wahrscheinlichkeit liegt der „wahre“ Wert in diesem Bereich. Bei metrischen Variablen dürften Konfidenzintervalle üblicher und vertrauter sein als bei kategorialen. So liefert SPSS beispielsweise beim t-Test für unabhängige Stichproben das 95%-Konfidenzintervall der Differenz automatisch mit. Doch wie sieht es aus bei kategorialen Variablen? Nehmen wir als Beispiel … „Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?“ weiterlesen
Mehrfachantworten in benutzerdefinierten SPSS-Tabellen: Anzahl Befragte UND Anzahl der Nennungen darstellen
Die Herausforderung bei Mehrfachantworten besteht darin, die Prozentzahlen korrekt zu interpretieren und insbesondere zwischen Prozent der Befragten und Prozent der Antworten zu unterscheiden. Dies habe ich in einem früheren Artikel anhand des MULT RESPONSE-Befehls dargestellt. SPSS hat sich offenbar entschieden, die mögliche Verwirrung, die aus Gesamt-Prozenten >100% entstehen kann, bei benutzerdefinierten Tabellen so zu lösen: … „Mehrfachantworten in benutzerdefinierten SPSS-Tabellen: Anzahl Befragte UND Anzahl der Nennungen darstellen“ weiterlesen