Der Olympia-Score im Medaillenspiegel

Pünktlich zur Olympia-Zeit, zum Beginn der olympischen Spiele freue ich mich, wieder einen Gastbeitrag von Tim Scheffczyk präsentieren zu können. Dabei geht es um eine alternative Methode, die Rangliste der Nationen anhand des Medaillenspiegels zu berechnen, wobei Silber- und Bronzemedaillen stärker berücksichtigt werden als bisher üblich. Die olympischen Spiele sind der allergrößte internationale sportliche Wettstreit. … „Der Olympia-Score im Medaillenspiegel“ weiterlesen

Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen

Der Zehnkampf gilt als die Königsdisziplin der Leichtathletik. Die Internationale Leichtathletik-Mehrkampfwertung der IAAF (International Amateur Athletics Federation) bewertet jede Leistung in den zehn Wettbewerben. Die Leistungen aus zehn Wettbewerben werden aggregiert und zu einer Punktzahl zusammengefasst. Die aktuelle Wertungstabelle wird international seit 1985 angewandt. Die IAAF-Wettbewerbstabelle basiert auf statistischen Analysen der Leistungen in den Einzeldisziplinen. … „Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen“ weiterlesen

Verdeckte Korrelationen sichtbar machen in R mit linearen Modellen

Nach meinem Eindruck erhalten verdeckte Korrelationen weniger Aufmerksamkeit als ihre bekannteren Kollegen, die Scheinkorrelationen. Dabei stellen beide Phänomene ähnliche Herausforderungen für die Datenanalyse dar. Eine verdeckte Korrelation liegt vor, wenn ein Zusammenhang zwischen zwei Variablen besteht, aber nicht direkt sichtbar wird, weil er von (mindestens) einer anderen Variable verdeckt oder überlagert wird. Kein Zusammenhang zwischen … „Verdeckte Korrelationen sichtbar machen in R mit linearen Modellen“ weiterlesen

Scheinkorrelationen aufdecken in R mit linearen Regressionsmodellen

Störche bringen Babies – das wohl bekannteste Beispiel der Statistik für eine klassische Scheinkorrelation. Der Zusammenhang ist tatsächlich statistisch nachweisbar – es handelt sich jedoch (nach heutigem Wissen) nicht um einen Kausalzusammenhang. Auch wenn uns das inhaltlich bekannt ist – wie können wir das statistisch belegen? In anderen Anwendungsfällen wird uns inhaltlich vielleicht nicht so … „Scheinkorrelationen aufdecken in R mit linearen Regressionsmodellen“ weiterlesen

t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)

Als Student fand ich die Vielzahl an statistischen Tests verwirrend. Das waren mir zu viele Schubladen – jeder Test macht irgendwie etwas anderes, wie soll man die auseinanderhalten und sich das alles merken? Dabei gibt es eine klare Verbindung zwischen den parametrischen Signifikanztests. Im Allgemeinen Linearen Modell (ALM) bzw. seiner Erweiterung Generalisiertes Lineares Modell (GLM, … „t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)“ weiterlesen

Korrelation: Pearson vs. Spearman als Youtube-Video

Es ist ein Phänomen: Der über drei Jahre alte Artikel Korrelation: Pearson vs. Spearman ist nach wie vor der meistgelesene Beitrag auf statistik-dresden.de. Jetzt gibt’s den Vergleich dieser beiden Zusammenhangsmaße als Video: Der Unterschied zwischen der Pearson-Korrelation und der Spearman-Korrelation wird anhand eines Praxisbeispiels demonstriert. Dabei tritt der ungewöhnliche Fall auf, dass einer der beiden … „Korrelation: Pearson vs. Spearman als Youtube-Video“ weiterlesen

Macht Geld glücklich? Europäische Staaten im Vergleich

Auch wenn die Überschrift nach einem Sprachspiel mit „Macht“ klingt – hier geht es „nur“ um den Zusammenhang zwischen Geld (Einkommen in Kaufkraft) und Lebenszufriedenheit. Die Anordnung zeigt einen relativ deutlichen Zusammenhang. Tendenziell gilt die Korrelation: Je höher das Einkommen, desto höher ist auch die allgemeine Lebenszufriedenheit. Allerdings gibt es durchaus Ausnahmen beim Vergleich einzelner … „Macht Geld glücklich? Europäische Staaten im Vergleich“ weiterlesen

PSPP: Wie gut ist die kostenlose Alternative zu SPSS?

IBM SPSS ist eine mächtige statistische Analysesoftware mit großem Funktionsumfang – und teuer. Wer die Lizenzgebühren nicht aufbringen kann oder will, stößt früher oder später auf PSPP, eine kostenlose Alternative, die unter der GNU General Public Licence steht. Der Name hat keine offizielle Bedeutung – er spielt lediglich auf SPSS an. Es gibt aber inoffizielle … „PSPP: Wie gut ist die kostenlose Alternative zu SPSS?“ weiterlesen

SPSS Modeler: Merkmalsauswahl (Feature Selection)

In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen