Datenvisualisierung: Informative Boxplots in R (ggplot2 und mehr)

Boxplots geben einen schnellen Überblick über Verteilungen. Wie kann man sie informativer gestalten als das Standard-Boxplot? Hier geht es um Ideen mit ggplot2 sowie einigen Erweiterungspaketen. Zum Einstieg in ggplot2 siehe die folgenden Beiträge: Das folgende Video ist mein erstes, das auf einem Storyboard basiert – umgesetzt mit dem flexdashboard-Paket, das eine Erweiterung des R … „Datenvisualisierung: Informative Boxplots in R (ggplot2 und mehr)“ weiterlesen

Der Ratingscore – Eine statistische Analyse von Bewertungskennzahlen

Gastbeitrag von Tim Scheffczyk Ratingscore: Zusammenfassung Digitale Marktplätze dienen ebenso wie klassische Handelsplätze dazu, Angebot und Nachfrage zu koordinieren. Charakteristisch für beide Marktformen ist das Vorliegen asymmetrischer Informationsverteilung zwischen den Verkäufern und potentiellen Käufern von Produkten. Der Verkäufer besitzt gegenüber einem (potentiellen) Käufer einen Informationsvorteil. Auf den klassischen Marktplätzen wird diese Asymmetrie beispielsweise durch das … „Der Ratingscore – Eine statistische Analyse von Bewertungskennzahlen“ weiterlesen

Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?

Balken- und Säulendiagramme werden immer noch häufig verwendet, um Mittelwertsunterschiede darzustellen – obwohl zumindest in Fachkreisen schon viel Kritik an diesem Diagrammtyp geäußert wurde. Für einen schnellen optischen Eindruck mag es passen – oder auch nicht. Der Mittelwert allein ist nur ein Aspekt einer Verteilung. Hier ein Beispiel: require(ggplot2) ggplot(daten) + aes(x = Geschlecht, y … „Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?“ weiterlesen

Wo ist Studieren am günstigsten? Dresden in den Top 10 / Kuriose Statistik

In welchen Hochschulstädten sind die Lebenshaltungskosten am geringsten? Nach einem Ranking eines Hochschulmagazins* liegt Dresden in den Top 10 und ist günstiger als Leipzig. Die Rangliste der günstigsten Uni-Städte mit den monatlichen Gesamtkosten (die natürlich je nach Lebensweise schwanken): Zittau (Sachsen): 630 € / Monat Freiberg (Sachsen): 666 € / Monat Zwickau (Sachsen): 667 € … „Wo ist Studieren am günstigsten? Dresden in den Top 10 / Kuriose Statistik“ weiterlesen

Marktforschung: Gehaltsstudie 2014

Wie entwickeln sich die Gehälter in der Marktforschungsbranche? Marktforschung.de veröffentlichte in Zusammenarbeit mit tivian die Gehaltsstudie 2014. Einige Zahlen:  Durchschnittliches Jahreseinkommen in der Marktforschung 2013/14: 54.290 € Dieser Wert liegt um rund 3.700 Euro signifikant über dem Durchschnittsgehalt 2011/2012; allerdings war das ein Rückgang gegenüber 2010/11; die Studienautoren werten die Veränderungen als „unsystematische Schwankungen“; der Korridor … „Marktforschung: Gehaltsstudie 2014“ weiterlesen

Statistik als Live-Erlebnis: 200 Länder, 200 Jahre, 120.000 Datenpunkte in 4 Minuten

Wie kann man eine riesige Anzahl statistischer Daten über Bevölkerungsentwicklung, Einkommen, Gesundheit in vielen Ländern und über Jahrzehnte anschaulich darstellen? Hans Rosling gibt beeindruckende Beispiele, wie das, was nach sehr trockenem Stoff klingen mag, zum spannenden Live-Erlebnis wird: 200 Länder, 200 Jahre, 120.000 (!) Datenpunkte – in vier Minuten! (englisch) Mittelwerte hinterfragen: Blick auf Verteilungen, … „Statistik als Live-Erlebnis: 200 Länder, 200 Jahre, 120.000 Datenpunkte in 4 Minuten“ weiterlesen

Gesungene Statistik

Heute möchte ich Euch zwei Beiträge aus der Reihe „Gesungene Statistik“ vorstellen. Den Anfang macht Hans-Eckardt Wenzel, ein Liedermacher und Lyriker aus der Nähe von Wittenberg, den ich sehr schätze: „Santa Statistica, glühende Sonne der Soziologie“ … Wem das nicht genügt: ein Beitrag aus dem Bereich der Countrymusik, „Statistically Honky Tonk“. Hier geht es vor … „Gesungene Statistik“ weiterlesen

SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?

Der SPSS Modeler, die High-End-Statistik-Lösung von IBM SPSS, wartet mit einem vielversprechenden Knoten für die Datenvorbereitung auf: der Automatischen Datenvorbereitung (ADP, Automatic Data Preparation). Datenvorbereitung ist oft der zeitaufwändigste Arbeitsschritt Wer sich schon mal intensiver mit Datenauswertung oder data mining beschäftigt hat, hat sehr wahrscheinlich die Erfahrung gemacht, dass die Datenvorbereitung oft der zeitintensivste Arbeitsschritt … „SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen

Mittelwert oder Median? Beschreibung der Einkommensverteilung

Ein einfaches Beispiel: wir betrachten eine übersichtliche Stichprobe mit drei Personen, die über folgende Monatseinkommen verfügen: Person A: 1.000 € Person B: 1.000 € Person D: 998.000 € Das Durchschnittseinkommen beträgt: (1.000 € + 1.000 € + 998.000 €) / 3 = 1 Million € / 3 = 333.333 € Nehmen wir an, die drei … „Mittelwert oder Median? Beschreibung der Einkommensverteilung“ weiterlesen