Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht

Ich bin ein Verfechter des „Mosaik“-Ansatzes: mit mehreren Ansätzen auf Daten schauen, um Schritt für Schritt (Steinchen für Steinchen) ein klareres Bild zu erhalten. Einfaches Praxisbeispiel: Zwei Schulklassen mit nur je zwei Schüler(innen). Zensuren: Klasse A 3, 3; Klasse B 1, 5. In beiden Klassen gilt: Durchschnittsnote = 3, N (Fallzahl) = 2. Bleibt man … „Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen (manchmal) nicht“ weiterlesen

Korrelation: Pearson vs. Spearman

Sollten Zusammenhänge zwischen zwei mindestens ordinal skalierten Variablen mit dem Korrelationskoeffizienten nach Pearson (für intervallskalierte Merkmale) oder mit der Spearman’schen Rangkorrelation ermittelt werden? In der Praxis unterscheiden sich die Ergebnisse oft nur geringfügig. Selten kommt man bei der Korrelation zu unterschiedlichen Aussagen – und wenn, dann ist das eine Maß knapp über und das andere … „Korrelation: Pearson vs. Spearman“ weiterlesen

Korrelation: Je mehr Störche, desto mehr Kinder

Ein Klassiker der Statistik … Man kann tatsächlich nachweisen, dass in Regionen mit mehr Störchen auch mehr Kinder „auf die Welt kommen“. Ist damit bewiesen, dass Störche Kinder bringen? Medizinisch-biologische Erkenntnisse sprechen dagegen – es gibt andere, gut belegte Theorien dazu, wie Kinder entstehen und von wo sie „gebracht“ werden. So weit, so klar – … „Korrelation: Je mehr Störche, desto mehr Kinder“ weiterlesen

Interaktionseffekt / Moderatoreffekt

Interaktionseffekte (Moderatoreffekte) werden oft als schwierig nachvollziehbar empfunden. Kurz gesagt hängt bei einem Moderatoreffekt die Wirkung einer Variablen auf eine andere vom Zustand einer weiteren Variable, dem Moderator, ab. Klingt zu abstrakt? Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video: Regressionsmodelle visualisieren in R (ggplot2, plotly) Moderatoreffekte im Video   … „Interaktionseffekt / Moderatoreffekt“ weiterlesen

Warum multivariate Methoden? Für kommerzielle Forschung reichen doch Kreuztabellen!

Der Kunde muss die Analyse verstehen können! Dieses Argument habe ich schon öfter zu hören bekommen. Folgendes Beispiel mag zeigen, warum multivariate Verfahren durchaus angemessen sein können. Annahme: Jugendliche mit höherer Sportorientierung ernähren sich gesünder als Jugendliche mit geringerer Sportorientierung. Lässt sich diese Annahme anhand vorliegender Befragungsdaten bestätigen? Korrelationsanalyse [man könnte auch Mittelwerte bilden und in … „Warum multivariate Methoden? Für kommerzielle Forschung reichen doch Kreuztabellen!“ weiterlesen