Neben Scheinkorrelationen gibt es auch verdeckte Korrelationen: Es besteht tatsächlich ein Zusammenhang zwischen zwei Merkmalen, die statistische Korrelation ist jedoch nahe 0. Grund: eine intervenierende Variable verdeckt den Zusammenhang. Fiktives Beispiel: Es wird untersucht, welchen Einfluss ein unterschiedlich intensiver Kontakt mit einer bestimmten Tabakwerbung auf das Rauchverhalten von Jugendlichen ausübt. Die Korrelation ist überraschenderweise 0. … „Verdeckte Korrelation“ weiterlesen
Statistik-Blog
Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?
Korrelation: Zusammenhang zwischen (meist zwei) Merkmalen Kausalität: Annahme, dass eines der Merkmale die Ursache für das andere ist Um einen Kausalzusammenhang zu begründen, reicht es nicht aus, auf das gemeinsame Auftreten von zwei Ereignissen zu verweisen. Um eine wissenschaftliche Erklärung zu liefern, muss man auch einen Mechanismus angeben, der zeigt, wie ein Merkmal / Ereignis … „Korrelation und Kausalität: Steffi Graf und Boris Becker als Auslöser der Wende in der DDR?“ weiterlesen
Statistik = Wanderkarte
Statistik ist eine Wanderkarte. Wenn man sie zu sehen bekommt, ist sie von der Realität schon etwas überholt. Dennoch gibt sie Orientierung. Man muss sie mit Verstand lesen können, sonst geht man in die Irre. Martin Kruse (*1929), lutherischer Theologe Dank an Familie Stubig. Anmerkung: Wenn man als wissenschaftlischer Forscher „in die Irre geht“, heißt … „Statistik = Wanderkarte“ weiterlesen
Siege am seidenen Faden: Squash WM 2002-2006
In jüngeren Jahren war ich begeisterter Squashspieler. Ein gewisses Interesse ist geblieben. Für Wahrscheinlichkeits-Freaks – hat jemand Lust, dazu was zu rechnen? Wie wahrscheinlich ist es, dass solche Ergebnisse zustande kommen? Bei den Squash-Weltmeisterschaften der Jahre 2002 bis 2006 gab es in vier von fünf Fällen Sieger, die mindestens zwei Matchbälle abwehren mussten. 2002: zwei … „Siege am seidenen Faden: Squash WM 2002-2006“ weiterlesen
Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht
Ich bin ein Verfechter des „Mosaik“-Ansatzes: mit mehreren Ansätzen auf Daten schauen, um Schritt für Schritt (Steinchen für Steinchen) ein klareres Bild zu erhalten. Einfaches Praxisbeispiel: Zwei Schulklassen mit nur je zwei Schüler(innen). Zensuren: Klasse A 3, 3; Klasse B 1, 5. In beiden Klassen gilt: Durchschnittsnote = 3, N (Fallzahl) = 2. Bleibt man … „Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht“ weiterlesen
Korrelation: Pearson vs. Spearman
Sollten Zusammenhänge zwischen zwei mindestens ordinal skalierten Variablen mit dem Korrelationskoeffizienten nach Pearson (für intervallskalierte Merkmale) oder mit der Spearman’schen Rangkorrelation ermittelt werden? In der Praxis unterscheiden sich die Ergebnisse oft nur geringfügig. Selten kommt man bei der Korrelation zu unterschiedlichen Aussagen – und wenn, dann ist das eine Maß knapp über und das andere … „Korrelation: Pearson vs. Spearman“ weiterlesen
Sieg am seidenen Faden: Boris Becker, US Open 1989
Wie wahrscheinlich war Beckers Turniersieg in dieser Situation? US Open 1989, 2. Runde: Boris Becker verliert die ersten beiden Sätze gegen Derrick Rostagno, holt sich den dritten. Im vierten kommt es zum Tiebreak, Rostagno hat beim Stand von 6:4 zwei Matchbälle. Beim zweiten spielt er einen sehr guten Return, hat Becker in der Ecke, steht … „Sieg am seidenen Faden: Boris Becker, US Open 1989“ weiterlesen
Korrelation: Je mehr Störche, desto mehr Kinder
Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Korrelation: Je mehr Störche, desto mehr Kinder“ weiterlesen
Interaktionseffekt / Moderatoreffekt
Interaktionseffekte (Moderatoreffekte) werden oft als schwierig nachvollziehbar empfunden. Kurz gesagt hängt bei einem Moderatoreffekt die Wirkung einer Variablen auf eine andere vom Zustand einer weiteren Variable, dem Moderator, ab. Klingt zu abstrakt? Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video: Regressionsmodelle visualisieren in R (ggplot2, plotly) Moderatoreffekte im Video … „Interaktionseffekt / Moderatoreffekt“ weiterlesen
Traue keiner Statistik …
… die Du nicht selbst gefälscht hast. Oder: „Ich traue keiner Statistik, die ich nicht selbst gefälscht habe.“ Dieses berühmte Zitat wurde häufig Winston Churchill zugeschrieben, allerdings fand sich dafür kein haltbarer Beleg. Werner Barke schreibt im Statistischen Monatsheft Baden-Württemberg 11/2004, nichts spreche für die Richtigkeit des Zitats, und alles dagegen. Quelle: statistik.baden-wuerttemberg.de [URL nicht mehr erreichbar] … „Traue keiner Statistik …“ weiterlesen