Korrelation und Wirkungsrichtung: Markenimage und Marktanteil

Befunde von Korrelationsanalysen können auf mehrere Arten falsch interpretiert werden. In früheren Artikeln habe ich bereits auf Scheinkorrelationen, verdeckte Korrelationen und Kausalinterpretationen hingewiesen. Eine weitere Möglichkeit bietet die Frage nach der Wirkungsrichtung. Korrelationsanalysen sind symmetrisch – A korreliert mit B genau so stark wie B mit A. In welcher Richtung der Einfluss tatsächlich ausgeübt wird, … „Korrelation und Wirkungsrichtung: Markenimage und Marktanteil“ weiterlesen

Regressionsmodelle: R², Zielsetzung / Denkmodelle

Meines Erachtens gibt es zwei recht unterschiedliche Arten, mit Regressionsmodellen umzugehen. Das „empiristische“ Vorgehen Die erste, die ich wesentlich häufiger antreffe, geht von der Vorstellung aus: Regressionsmodelle sind dafür da, Zusammenhänge möglichst genau zu „erklären“ bzw. möglichst gute Prognosen zu erstellen. In dieser Denkweise ist R² (der erklärte Varianzanteil) das entscheidende Gütemaß. Wenn Studien vorgestellt werden, … „Regressionsmodelle: R², Zielsetzung / Denkmodelle“ weiterlesen

Mein neuer methodischer Lieblings-Fachbegriff: Die „rezeptbasierte Restaurant Kohortenstudie“

Was tun, wenn die Ursache des EHEC-Ausbruch nicht so einfach einzugrenzen ist? Wochenlange epidemiologische Studien des Robert-Koch-Instituts in Zusammenarbeit mit Gesundheits- und Lebensmittelbehörden konnten zwar klären, dass betroffene Patienten signifikant häufiger rohe Tomaten, Salatgurken und Blattsalate verzehrt hatten als gesunde Studienteilnehmer. Eine genauere Eingrenzung der Gemüsesorten gelang jedoch nicht. In diesem Fall half nicht Superman, … „Mein neuer methodischer Lieblings-Fachbegriff: Die „rezeptbasierte Restaurant Kohortenstudie““ weiterlesen

Soziale Netzwerke: Schönes Beispiel für grafische Veranschaulichung

Wer in der Marktforschungsbranche beschäftigt ist, steht immer wieder vor der Frage: Wie kann ich Ergebnisse statistischer Auswertungen grafisch veranschaulichen? Ein besonders schönes Beispiel liefert xkcd mit dieser Landkarte sozialer Netzwerke: Interessant ist der Vergleich zu 2007: damals war z. B. MySpace noch wesentlich stärker als Gesichtsbuch. Ähnlichkeiten zum Herrn der Ringe dürften nicht ganz … „Soziale Netzwerke: Schönes Beispiel für grafische Veranschaulichung“ weiterlesen

Korrelationscartoon: Krebs verursacht Handies

Schön, wenn Statistik, die im Ruf steht, eher „trocken“ zu sein, auf nette Weise veranschaulicht wird. Besonders gelungen finde ich hier den Webcomic xkcd* – „A webcomic of romance, sarcasm, math, and language„. Einer meiner Favoriten beschreibt den Zusammenhang zwischen Handynutzung und Krebs und ist ein Update zu Korrelation und Kausalität: Wieder eine große Studie, die nicht … „Korrelationscartoon: Krebs verursacht Handies“ weiterlesen

Verdeckte Korrelation

Neben Scheinkorrelationen gibt es auch verdeckte Korrelationen: Es besteht tatsächlich ein Zusammenhang zwischen zwei Merkmalen, die statistische Korrelation ist jedoch nahe 0. Grund: eine intervenierende Variable verdeckt den Zusammenhang. Fiktives Beispiel: Es wird untersucht, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabakwerbung auf das Rauchverhalten von Jugendlichen ausübt. Die Korrelation ist überraschenderweise 0. … „Verdeckte Korrelation“ weiterlesen

Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?

Korrelation: Zusammenhang zwischen (meist zwei) Merkmalen Kausalität: Annahme, dass eines der Merkmale die Ursache für das andere ist Um einen Kausalzusammenhang zu begründen, reicht es nicht aus, auf das gemeinsame Auftreten von zwei Ereignissen zu verweisen. Um eine wissenschaftliche Erklärung zu liefern, muss man auch einen Mechanismus angeben, der zeigt, wie ein Merkmal / Ereignis … „Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?“ weiterlesen

Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht

Ich bin ein Verfechter des „Mosaik“-Ansatzes: mit mehreren Ansätzen auf Daten schauen, um Schritt für Schritt (Steinchen für Steinchen) ein klareres Bild zu erhalten. Einfaches Praxisbeispiel: Zwei Schulklassen mit nur je zwei Schüler(innen). Zensuren: Klasse A 3, 3; Klasse B 1, 5. In beiden Klassen gilt: Durchschnittsnote = 3, N (Fallzahl) = 2. Bleibt man … „Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht“ weiterlesen

Korrelation: Pearson vs. Spearman

Sollten Zusammenhänge zwischen zwei mindestens ordinal skalierten Variablen mit dem Korrelationskoeffizienten nach Pearson (für intervallskalierte Merkmale) oder mit der Spearman’schen Rangkorrelation ermittelt werden? In der Praxis unterscheiden sich die Ergebnisse oft nur geringfügig. Selten kommt man zu unterschiedlichen Aussagen – und wenn, dann ist das eine Maß knapp über und das andere knapp unterhalb der … „Korrelation: Pearson vs. Spearman“ weiterlesen

Je mehr Störche, desto mehr Kinder

Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Je mehr Störche, desto mehr Kinder“ weiterlesen