Verdeckte Korrelation

Neben Scheinkorrelationen gibt es auch verdeckte Korrelationen: Es besteht tatsächlich ein Zusammenhang zwischen zwei Merkmalen, die statistische Korrelation ist jedoch nahe 0. Grund: eine intervenierende Variable verdeckt den Zusammenhang. Fiktives Beispiel: Es wird untersucht, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabakwerbung auf das Rauchverhalten von Jugendlichen ausübt. Die Korrelation ist überraschenderweise 0. … „Verdeckte Korrelation“ weiterlesen

Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?

Korrelation: Zusammenhang zwischen (meist zwei) Merkmalen Kausalität: Annahme, dass eines der Merkmale die Ursache für das andere ist Um einen Kausalzusammenhang zu begründen, reicht es nicht aus, auf das gemeinsame Auftreten von zwei Ereignissen zu verweisen. Um eine wissenschaftliche Erklärung zu liefern, muss man auch einen Mechanismus angeben, der zeigt, wie ein Merkmal / Ereignis … „Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?“ weiterlesen

Statistik = Wanderkarte

Statistik ist eine Wanderkarte. Wenn man sie zu sehen bekommt, ist sie von der Realität schon etwas überholt. Dennoch gibt sie Orientierung. Man muss sie mit Verstand lesen können, sonst geht man in die Irre. Martin Kruse (*1929), lutherischer Theologe Dank an Familie Stubig. Anmerkung: Wenn man als wissenschaftlischer Forscher „in die Irre geht“, heißt … „Statistik = Wanderkarte“ weiterlesen

Siege am seidenen Faden: Squash WM 2002-2006

In jüngeren Jahren war ich begeisterter Squashspieler. Ein gewisses Interesse ist geblieben. Für Wahrscheinlichkeits-Freaks – hat jemand Lust, dazu was zu rechnen? Wie wahrscheinlich ist es, dass solche Ergebnisse zustande kommen? Bei den Squash-Weltmeisterschaften der Jahre 2002 bis 2006 gab es in vier von fünf Fällen Sieger, die mindestens zwei Matchbälle abwehren mussten. 2002: zwei … „Siege am seidenen Faden: Squash WM 2002-2006“ weiterlesen

Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht

Ich bin ein Verfechter des „Mosaik“-Ansatzes: mit mehreren Ansätzen auf Daten schauen, um Schritt für Schritt (Steinchen für Steinchen) ein klareres Bild zu erhalten. Einfaches Praxisbeispiel: Zwei Schulklassen mit nur je zwei Schüler(innen). Zensuren: Klasse A 3, 3; Klasse B 1, 5. In beiden Klassen gilt: Durchschnittsnote = 3, N (Fallzahl) = 2. Bleibt man … „Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht“ weiterlesen

Korrelation: Pearson vs. Spearman

Sollten Zusammenhänge zwischen zwei mindestens ordinal skalierten Variablen mit dem Korrelationskoeffizienten nach Pearson (für intervallskalierte Merkmale) oder mit der Spearman’schen Rangkorrelation ermittelt werden? In der Praxis unterscheiden sich die Ergebnisse oft nur geringfügig. Selten kommt man zu unterschiedlichen Aussagen – und wenn, dann ist das eine Maß knapp über und das andere knapp unterhalb der … „Korrelation: Pearson vs. Spearman“ weiterlesen

Sieg am seidenen Faden: Boris Becker, US Open 1989

Wie wahrscheinlich war Beckers Turniersieg in dieser Situation? US Open 1989, 2. Runde: Boris Becker verliert die ersten beiden Sätze gegen Derrick Rostagno, holt sich den dritten. Im vierten kommt es zum Tiebreak, Rostagno hat beim Stand von 6:4 zwei Matchbälle. Beim zweiten spielt er einen sehr guten Return, hat Becker in der Ecke, steht … „Sieg am seidenen Faden: Boris Becker, US Open 1989“ weiterlesen

Je mehr Störche, desto mehr Kinder

Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Je mehr Störche, desto mehr Kinder“ weiterlesen

Interaktionseffekt / Moderatoreffekt

Interaktionseffekte (Moderatoreffekte) werden oft als schwierig nachvollziehbar empfunden. Kurz gesagt ist der Effekt einer Variablen auf eine andere unterschiedlich, je nach Zustand einer weiteren. Klingt zu abstrakt? Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video: Regressionsmodelle visualisieren in R (ggplot2, plotly) Moderatoreffekte im Video   In einer Studie fand ich … „Interaktionseffekt / Moderatoreffekt“ weiterlesen