Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?

Balken- und Säulendiagramme werden immer noch häufig verwendet, um Mittelwertsunterschiede darzustellen – obwohl zumindest in Fachkreisen schon viel Kritik an diesem Diagrammtyp geäußert wurde. Für einen schnellen optischen Eindruck mag es passen – oder auch nicht. Der Mittelwert allein ist nur ein Aspekt einer Verteilung. Hier ein Beispiel: require(ggplot2) ggplot(daten) + aes(x = Geschlecht, y … „Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?“ weiterlesen

Wo ist Studieren am günstigsten? Dresden in den Top 10 / Kuriose Statistik

In welchen Hochschulstädten sind die Lebenshaltungskosten am geringsten? Nach einem Ranking eines Hochschulmagazins* liegt Dresden in den Top 10 und ist günstiger als Leipzig. Die Rangliste der günstigsten Uni-Städte mit den monatlichen Gesamtkosten (die natürlich je nach Lebensweise schwanken): Zittau (Sachsen): 630 € / Monat Freiberg (Sachsen): 666 € / Monat Zwickau (Sachsen): 667 € … „Wo ist Studieren am günstigsten? Dresden in den Top 10 / Kuriose Statistik“ weiterlesen

Marktforschung: Gehaltsstudie 2014

Wie entwickeln sich die Gehälter in der Marktforschungsbranche? Marktforschung.de veröffentlichte in Zusammenarbeit mit tivian die Gehaltsstudie 2014. Einige Zahlen:  Durchschnittliches Jahreseinkommen in der Marktforschung 2013/14: 54.290 € Dieser Wert liegt um rund 3.700 Euro signifikant über dem Durchschnittsgehalt 2011/2012; allerdings war das ein Rückgang gegenüber 2010/11; die Studienautoren werten die Veränderungen als „unsystematische Schwankungen“; der Korridor … „Marktforschung: Gehaltsstudie 2014“ weiterlesen

Statistik als Live-Erlebnis: 200 Länder, 200 Jahre, 120.000 Datenpunkte in 4 Minuten

Wie kann man eine riesige Anzahl statistischer Daten über Bevölkerungsentwicklung, Einkommen, Gesundheit in vielen Ländern und über Jahrzehnte anschaulich darstellen? Hans Rosling gibt beeindruckende Beispiele, wie das, was nach sehr trockenem Stoff klingen mag, zum spannenden Live-Erlebnis wird: 200 Länder, 200 Jahre, 120.000 (!) Datenpunkte – in vier Minuten! (englisch) Schön, dass bei all der … „Statistik als Live-Erlebnis: 200 Länder, 200 Jahre, 120.000 Datenpunkte in 4 Minuten“ weiterlesen

Gesungene Statistik

Heute möchte ich Euch zwei Beiträge aus der Reihe „Gesungene Statistik“ vorstellen. Den Anfang macht Hans-Eckardt Wenzel, ein Liedermacher und Lyriker aus der Nähe von Wittenberg, den ich sehr schätze: „Santa Statistica, glühende Sonne der Soziologie“ … Wem das nicht genügt: ein Beitrag aus dem Bereich der Countrymusik, „Statistically Honky Tonk“. Hier geht es vor … „Gesungene Statistik“ weiterlesen

SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?

Der SPSS Modeler, die High-End-Statistik-Lösung von IBM SPSS, wartet mit einem vielversprechenden Knoten für die Datenvorbereitung auf: der Automatischen Datenvorbereitung (ADP, Automatic Data Preparation). Datenvorbereitung ist oft der zeitaufwändigste Arbeitsschritt Wer sich schon mal intensiver mit Datenauswertung oder data mining beschäftigt hat, hat sehr wahrscheinlich die Erfahrung gemacht, dass die Datenvorbereitung oft der zeitintensivste Arbeitsschritt … „SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen

Mittelwert oder Median? Beschreibung der Einkommensverteilung

Ein einfaches Beispiel: wir betrachten eine übersichtliche Stichprobe mit drei Personen, die über folgende Monatseinkommen verfügen: Person A: 1.000 € Person B: 1.000 € Person D: 998.000 € Das Durchschnittseinkommen beträgt: (1.000 € + 1.000 € + 998.000 €) / 3 = 1 Million € / 3 = 333.333 € Nehmen wir an, die drei … „Mittelwert oder Median? Beschreibung der Einkommensverteilung“ weiterlesen

Benutzerdefinierte Tabellen mit SPSS (ctables): Beispiele für Mittelwerte

Aufgabe: Es sollen Altersdurchschnitte nach Geschlecht und Region ermittelt werden. Die einfachste Syntax dafür lautet: means age by sex. means age by region. Wir erhalten zwei separate Tabellen und als voreingestellte Kennwerte (default) den Mittelwert, die Fallzahl und die Standardabweichung. Erste Verbesserung: wir möchten zusätzlich Minimum und Maximum ausgeben und die Standardabweichung an die zweite … „Benutzerdefinierte Tabellen mit SPSS (ctables): Beispiele für Mittelwerte“ weiterlesen

T-Test oder U-Test?

Bei Mittelwertvergleichen steht der Forscher oft vor der Frage, ob parametrische Verfahren wie der t-Test eingesetzt werden können oder ob auf nichtparametrische Tests wie den Mann-Whitney-U-Test ausgewichen werden muss. Parametrische Verfahren weisen eine höhere Teststärke auf, d. h. sie können tatsächlich vorhandene Unterschiede eher nachweisen, da sie mehr Informationen in den Daten nutzen. Ihr Nachteil … „T-Test oder U-Test?“ weiterlesen