Scheinkorrelationen aufdecken in R mit linearen Regressionsmodellen

Störche bringen Babies – das wohl bekannteste Beispiel der Statistik für eine klassische Scheinkorrelation. Der Zusammenhang ist tatsächlich statistisch nachweisbar – es handelt sich jedoch (nach heutigem Wissen) nicht um einen Kausalzusammenhang. Auch wenn uns das inhaltlich bekannt ist – wie können wir das statistisch belegen? In anderen Anwendungsfällen wird uns inhaltlich vielleicht nicht so … „Scheinkorrelationen aufdecken in R mit linearen Regressionsmodellen“ weiterlesen

Mediatoranalyse

Ein Mediatoreffekt liegt vor, wenn die Beziehung zwischen X und Y durch einen Mediator Z „vermittelt“ wird. Ein Beispiel (nach Urban und Mayerl): Man nimmt an, dass Menschen mit zunehmendem Alter autoritärer werden, weil sie nach und nach mehr Verantwortung übernehmen müssen. Eine weitere Annahme lautet, dass höherer Autoritarismus mit höherer Ausländer-Ablehnung einher geht. Somit … „Mediatoranalyse“ weiterlesen

Scheinkorrelation vs. intervenierende Variable

In anderen Artikeln habe ich bereits auf Scheinkorrelationen hingewiesen, z. B. den statistischen Klassiker: Je mehr Störche es in einer Region gibt, desto mehr Kinder gibt es dort auch. Typisch für eine Scheinkorrelation ist: betrachtet man lediglich den Zusammenhang zwischen zwei Variablen, ohne auf weitere Merkmale zu achten, so ist dieser statistisch bedeutsam. Die Gültigkeit … „Scheinkorrelation vs. intervenierende Variable“ weiterlesen

Signifikanz

Ähnlich wie der Begriff Repräsentativität ist auch der Begriff Signifikanz nur sinnvoll anwendbar, wenn ein statistisches Ergebnis aus einer Stichprobe auf eine Grundgesamtheit verallgemeinert werden soll. Statistische Signifikanz liegt dann vor, wenn die Irrtumswahrscheinlichkeit nicht über einem festgelegten Niveau liegt. Findet man z. B. einen positiven Zusammenhang (Korrelation) zwischen Alter und Einkommen (je älter ein … „Signifikanz“ weiterlesen

Korrelation und Wirkungsrichtung: Markenimage und Marktanteil

Befunde von Korrelationsanalysen können auf mehrere Arten falsch interpretiert werden. In früheren Artikeln habe ich bereits auf Scheinkorrelationen, verdeckte Korrelationen und Kausalinterpretationen hingewiesen. Eine weitere Möglichkeit bietet die Frage nach der Wirkungsrichtung. Korrelationsanalysen sind symmetrisch – A korreliert mit B genau so stark wie B mit A. In welcher Richtung der Einfluss tatsächlich ausgeübt wird, … „Korrelation und Wirkungsrichtung: Markenimage und Marktanteil“ weiterlesen

Regressionsmodelle: R², Zielsetzung / Denkmodelle

Meines Erachtens gibt es zwei recht unterschiedliche Arten, mit Regressionsmodellen umzugehen. Das „empiristische“ Vorgehen Die erste, die ich wesentlich häufiger antreffe, geht von der Vorstellung aus: Regressionsmodelle sind dafür da, Zusammenhänge möglichst genau zu „erklären“ bzw. möglichst gute Prognosen zu erstellen. In dieser Denkweise ist R² (der erklärte Varianzanteil) das entscheidende Gütemaß. Wenn Studien vorgestellt werden, … „Regressionsmodelle: R², Zielsetzung / Denkmodelle“ weiterlesen

Korrelation: Je mehr Störche, desto mehr Kinder

Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Korrelation: Je mehr Störche, desto mehr Kinder“ weiterlesen

Warum multivariate Methoden? Für kommerzielle Forschung reichen doch Kreuztabellen!

Der Kunde muss die Analyse verstehen können! Dieses Argument habe ich schon öfter zu hören bekommen. Folgendes Beispiel mag zeigen, warum multivariate Verfahren durchaus angemessen sein können. Annahme: Jugendliche mit höherer Sportorientierung ernähren sich gesünder als Jugendliche mit geringerer Sportorientierung. Lässt sich diese Annahme anhand vorliegender Befragungsdaten bestätigen? Korrelationsanalyse [man könnte auch Mittelwerte bilden und in … „Warum multivariate Methoden? Für kommerzielle Forschung reichen doch Kreuztabellen!“ weiterlesen