Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration“

Einige Stichpunkte zu aktuellen Trends und Herausforderungen der Marktforschung speziell im Kontext der Online-Befragungen: Befragungen werden zunehmend auf mobilen Endgeräten durchgeführt; Zahl der Befragten, die per Smartphone oder Tablet auf CAWI-Seiten (Computer Assisted Web Interviewing) zugreifen, hat sich von 2011 auf 2012 vervierfacht; aktueller Anteil mobiler Endgeräte an den Befragungen von Lightspeed Research: 5% technische … „Moderne (Online-) Marktforschung: Von „Big Data“ zu „Data Integration““ weiterlesen

Mediatoranalyse

Ein Mediatoreffekt liegt vor, wenn die Beziehung zwischen X und Y durch einen Mediator Z „vermittelt“ wird. Ein Beispiel (nach Urban und Mayerl): Man nimmt an, dass Menschen mit zunehmendem Alter autoritärer werden, weil sie nach und nach mehr Verantwortung übernehmen müssen. Eine weitere Annahme lautet, dass höherer Autoritarismus mit höherer Ausländer-Ablehnung einher geht. Somit … „Mediatoranalyse“ weiterlesen

Gehaltsunterschied zwischen Frauen und Männern im Osten geringer

Laut Statistischem Bundesamt verdienen Männer in Deutschland durchschnittlich 23% mehr als Frauen. Der Lohnunterschied ist jedoch regional sehr unterschiedlich: in Westdeutschland beträgt er 25%, im Osten nur 6%. Die Suche nach Gründen ist ein klassischer Anwendungsfall für multivariate Verfahren mit Drittvariablenkontrolle, z. B. Regressionsanalysen. Kontrolliert man das Einkommen nach Art der Tätigkeit und Ausbildung, so … „Gehaltsunterschied zwischen Frauen und Männern im Osten geringer“ weiterlesen

Scheinkorrelation vs. intervenierende Variable

In anderen Artikeln habe ich bereits auf Scheinkorrelationen hingewiesen, z. B. den statistischen Klassiker: Je mehr Störche es in einer Region gibt, desto mehr Kinder gibt es dort auch. Typisch für eine Scheinkorrelation ist: betrachtet man lediglich den Zusammenhang zwischen zwei Variablen, ohne auf weitere Merkmale zu achten, so ist dieser statistisch bedeutsam. Die Gültigkeit … „Scheinkorrelation vs. intervenierende Variable“ weiterlesen

Faktor / Faktoren

Faktor in der Alltagssprache Der Begriff Faktor ist aus der Alltagssprache geläufig. Z. B. lese ich in einem empfehlenswerten Zeit-Artikel von Harald Martenstein, „Die Taktik des Beleidigens“, den Satz: „Man kann sagen, dass Beleidigungen im Fußball ein spielentscheidender Faktor geworden sind.“ (Hinweis auf das WM-Finale 2006 und Zidanes Platzverweis.) Ein Faktor ist somit eine Ursache, … „Faktor / Faktoren“ weiterlesen

SPSS Syntaxbeispiel: Makros für Regressionsanalysen

Aufgabenstellung: Eine Reihe von Einzelregressionen mit jeweils einer unabhängigen Variablen berechnen. Einfache Lösung: Für jede unabängige Variable die Regressionssyntax anlegen. Z. B. so: REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV1. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV2. Und so weiter … „SPSS Syntaxbeispiel: Makros für Regressionsanalysen“ weiterlesen

SPSS Modeler: Maschinenlernen vs. Statistische Modelle

Statistische Modelle beruhen auf mathematische Gleichungen, wobei ein Algorithmus die vorgegebenen Parameter schätzt. Moderner und flexibler sind Techniken zum Maschinenlernen. Sie werden auf Basis minimaler Anforderungen an die Modellstruktur und minimalen Annahmen für das Modell berechnet. Die Form der Beziehungen wird während des Lernprozesses bestimmt. Beispiel: Lineare Regression vs. Neuronales Netzwerk (Neural Network) Falls sich … „SPSS Modeler: Maschinenlernen vs. Statistische Modelle“ weiterlesen

Logistische Regression: R²

Für logistische Regressionsmodelle wurde eine Vielzahl von Gütemaßen entwickelt: z. B. McFadden’s Pseudo-R², McKelvey & Zavoina’s R², ML (Cox-Snell) R², Cragg-Uhler (Nagelkerke) R², nicht adjustiertes Count R², Akaike’s Information Criterion (AIC), Bayesian Information Criterion (BIC). Im Gegensatz zur linearen Regression gibt es jedoch kein Maß mit einer ähnlich eindeutigen Interpretation im Sinne erklärter Varianz, und … „Logistische Regression: R²“ weiterlesen

Regressionsmodelle: R², Zielsetzung / Denkmodelle

Meines Erachtens gibt es zwei recht unterschiedliche Arten, mit Regressionsmodellen umzugehen. Das „empiristische“ Vorgehen Die erste, die ich wesentlich häufiger antreffe, geht von der Vorstellung aus: Regressionsmodelle sind dafür da, Zusammenhänge möglichst genau zu „erklären“ bzw. möglichst gute Prognosen zu erstellen. In dieser Denkweise ist R² (der erklärte Varianzanteil) das entscheidende Gütemaß. Wenn Studien vorgestellt werden, … „Regressionsmodelle: R², Zielsetzung / Denkmodelle“ weiterlesen

Korrelation: Je mehr Störche, desto mehr Kinder

Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Korrelation: Je mehr Störche, desto mehr Kinder“ weiterlesen