Statistische Gruppenvergleiche in R elegant visualisieren: ggstatsplot

Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.

Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.

Mist, der Test wird nicht signifikant: Kreativer Umgang mit p-Werten

Was macht man, wenn ein statistischer Signifikanztest nicht das tut, was er (vermeintlich!) soll: signifikant werden? xkcd kennt die Antwort: Vom kreativen Umgang mit p-Werten: Von „hochsignifikant“ bis zu „signifikant bei 10% Irrtumswahrscheinlichkeit“ und „Hey, schau Dir diese interessante Untergruppenanalyse an!“ Hier gibt es weitere Beiträge zum Thema Signifikanz.

t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)

Als Student fand ich die Vielzahl an statistischen Tests verwirrend. Das waren mir zu viele Schubladen – jeder Test macht irgendwie etwas anderes, wie soll man die auseinanderhalten und sich das alles merken? Dabei gibt es eine klare Verbindung zwischen den parametrischen Signifikanztests. Im Allgemeinen Linearen Modell (ALM) bzw. seiner Erweiterung Generalisiertes Lineares Modell (GLM, … „t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen

Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?

Fragst Du Dich: Welcher statistische Test passt für meine Aufgabe, meine Daten, meine Fragestellung? Die Universität Zürich bietet eine empfehlenswerte Hilfestellung bei der Auswahl des geeigneten statistischen Tests bzw. der passenden multivariaten Analysemethode. In einem Entscheidungsbaum sind Unterschiedstests und Verfahren für Zusammenhangs- und Interdependenzanalysen dargestellt; farbliche Abstufungen berücksichtigen das Skalenniveau (nominalskaliert, ordinalskaliert oder intervallskaliert); zusätzlich … „Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?“ weiterlesen

Signifikanztests bei Kreuztabellen: Kategorien sinnvoll zusammenfassen

Angenommen, Sie betreiben Marktforschung für eine Ladenkette, die Kühlschränke verkauft. Ihr Auftrag lautet, zwei Kundengruppen hinsichtlich ihres Kaufinteresses zu vergleichen. Sie erhalten folgende Kreuztabelle: Es gibt zwar gewisse Unterschiede zwischen den Kundengruppen (hier vereinfacht mit 0 und 1 bezeichnet), diese sind laut Chi-Quadrat-Test jedoch nicht signifikant (p=0,102). Ist der Auftrag damit bereits erledigt? Neu: Der … „Signifikanztests bei Kreuztabellen: Kategorien sinnvoll zusammenfassen“ weiterlesen

Monte Carlo

Woran denken Sie, wenn Sie Monte Carlo hören oder lesen? An die Formel 1 mit so klangvollen Namen wie Ayrton Senna (6facher Sieger), Alain Prost (4facher Sieger), Michael Schumacher (5facher Sieger)? An Tennis und den 8fachen Monte Carlo-Sieger Rafael Nadal, der seit 2005 jeden Titel dort abräumte und drei Mal in Folge Roger Federer im … „Monte Carlo“ weiterlesen

Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?

Das Konfidenzintervall ist ein Vertrauensbereich: mit der angegebenen Wahrscheinlichkeit liegt der „wahre“ Wert in diesem Bereich. Bei metrischen Variablen dürften Konfidenzintervalle üblicher und vertrauter sein als bei kategorialen. So liefert SPSS beispielsweise beim t-Test für unabhängige Stichproben das 95%-Konfidenzintervall der Differenz automatisch mit. Doch wie sieht es aus bei kategorialen Variablen? Nehmen wir als Beispiel … „Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?“ weiterlesen

Datenaufbereitung für abhängige Stichproben: long- und wide-Format

Angenommen, es liegen Daten in folgendem Format vor: ID Messzeitpunkt Messwert 1 1 7 1 2 10 2 1 4 2 2 3 …     Nun soll überprüft werden, ob die Daten des ersten Messzeitpunkts sich signifikant vom zweiten Messzeitpunkt unterscheiden. Ganz einfach, könnte man meinen: t-Test, Testvariable=Messwert, Gruppe=Messzeitpunkt (Gruppe 1 = Zeitpunkt 1, … „Datenaufbereitung für abhängige Stichproben: long- und wide-Format“ weiterlesen

T-Test oder U-Test?

Bei Mittelwertvergleichen steht der Forscher oft vor der Frage, ob parametrische Verfahren wie der t-Test eingesetzt werden können oder ob auf nichtparametrische Tests wie den Mann-Whitney-U-Test ausgewichen werden muss. Parametrische Verfahren weisen eine höhere Teststärke auf, d. h. sie können tatsächlich vorhandene Unterschiede eher nachweisen, da sie mehr Informationen in den Daten nutzen. Ihr Nachteil … „T-Test oder U-Test?“ weiterlesen