R für Umsteiger von Excel und SPSS: Automatisierte Berichte

In den letzten Jahren wurden mehrfach Artikel publiziert, die auf ein gravierendes Problem hinwiesen: Schätzungen zufolge sind deutlich mehr als die Hälfte der prä-klinischen Studienergebnisse nicht reproduzierbar. Wissenschaftliche Studienergebnisse oft nicht reproduzierbar So titelte das Wall Street Journal im Dezember 2011: “Scientists‘ Elusive Goal: Reproducing Study Results“. In der New York Times hieß es im … „R für Umsteiger von Excel und SPSS: Automatisierte Berichte“ weiterlesen

Storytelling mit R und ggplot2: Länderfinanzausgleich

ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzausgleich. Unter Storytelling verstehe ich hier: Bestimmte Aspekte hervorheben, die ich als Bearbeiter wichtig finde, um den Blick … „Storytelling mit R und ggplot2: Länderfinanzausgleich“ weiterlesen

Elegante R-Programmierung mit purrr::map und genisteten Datensätzen

2016 machte Hadley Wickham eine Idee populär, von der er zunächst selbst nicht sicher war, ob sie gut ist: genistete Datensätze (nested data frames). Das Prinzip ist einfach: Eine Spalte eines Datensatzes kann selbst ein Datensatz sein. Was zunächst umständlich oder verwirrend klingt, kann zum mächtigen Werkzeug werden – vor allem, wenn man viele gleich … „Elegante R-Programmierung mit purrr::map und genisteten Datensätzen“ weiterlesen

Länderfinanzausgleich: 30 Jahre in einer animierten Grafik (1988 – 2018)

Wie kann man die Beträge, die die Bundesländer im Rahmen des Länderfinanzausgleichs zahlten oder erhielten, in einer Grafik darstellen, sodass Veränderungen im Zeitverlauf deutlich werden? Hier eine animierte Grafik, die den Zeitraum von 1988, also kurz vor der Wende, bis 2018 abbildet: Länderfinanzausgleich: Entwicklungen 1988 bis 2018 In diesen 30 Jahren gab es mehrere spannende … „Länderfinanzausgleich: 30 Jahre in einer animierten Grafik (1988 – 2018)“ weiterlesen

Objektorientiertes Programmieren mit R: S3-Klassen

Die Open-Source-Software R ist ein großartiges Werkzeug zur Datenanalyse. Zahlreiche statistische Verfahren und Visualisierungen können mit wenigen Codezeilen erstellt werden. Dafür steht eine Vielzahl an Funktionen zur Verfügung. Funktionales Programmieren und Objektorientiertes Programmieren Automatisiert man solche Analysen, so bewegt man sich im Bereich des Funktionalen Programmierens. Für Datenanalysen ist das eine gute Wahl. Liegt der … „Objektorientiertes Programmieren mit R: S3-Klassen“ weiterlesen

Animierte Visualisierungen: Treemaps zum US-Haushaltsdefizit und zum Strommix in Deutschland

Manche Kennzahlen in unserer verrückten Welt wachsen exponentiell. In vielen Fällen zählen Staatsschulden und Haushaltsdefizite dazu. Oft werden solche Zusammenhänge in Liniendiagrammen dargestellt. Hier möchte ich eine alternative Darstellung vorschlagen: animierte Treemaps. Anstieg des US-Haushaltsdefizits nach Präsident: Animierte Treemap Hier geht es um einen visuellen Eindruck davon, wie stark das US-Haushaltsdefizit in den letzten Jahren … „Animierte Visualisierungen: Treemaps zum US-Haushaltsdefizit und zum Strommix in Deutschland“ weiterlesen

Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)

Regressionsmodelle sind nach wie vor sehr populär in der Statistik, dem Data Mining, Data Science und Machine Learning – das belegen aktuelle Zahlen, die KDNuggets kürzlich via Twitter präsentierte: Heute geht es um Möglichkeiten, solche Modelle mit der frei erhältlichen Software R / RStudio zu visualisieren. Wir nutzen den weit verbreiteten Datensatz mtcars, der in … „Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)“ weiterlesen

Ist White Christmas die erfolgreichste Single der Chartgeschichte? Daten ab 1900

Bing Crosby’s White Christmas drückt die Sehnsucht nach Weißer Weihnacht so überzeugend aus, dass es als bestverkaufte Single aller Zeiten gilt (Roy J. Harris Jr. im Wall Street Journal 2009). Gilt das auch für den Charterfolg? tsort.info hat ein ausgefeiltes Punktesystem entwickelt: Je länger in den Charts und je höher, desto mehr Punkte; berücksichtigt werden … „Ist White Christmas die erfolgreichste Single der Chartgeschichte? Daten ab 1900“ weiterlesen

Chart-Geschichte: Erfolgreichste Alben der 1990er Jahre

Welche Alben der 1990er Jahre erreichten den größten Chart-Erfolg? Die Top 5 der erfolgreichsten Alben, die bis 1989 erschienen, waren laut der Daten von tsort.info (Version 2.7.0010): The Beatles (1967): Sgt. Pepper’s Lonely Hearts Club Band Michael Jackson (1982): Thriller The Beatles (1969): Abbey Road U2 (1987): The Joshua Tree Bee Gees (1978): Saturday Night Fever … „Chart-Geschichte: Erfolgreichste Alben der 1990er Jahre“ weiterlesen

Chart-Geschichte: Erfolgreichste Alben der 1980er Jahre

Zwei Beatles-Alben überstanden die 1970er Jahre an der Spitze der Top 5 der erfolgreichsten Alben der Chartgeschichte: Sgt. Pepper’s Lonely Hearts Club Band und Abbey Road. Dahinter folgen die Bee Gees mit Saturday Night Fever, Pink Floyd mit Dark Side Of The Moon und Fleetwood Mac mit Rumours.  Wie verändern sich die Top 5 im … „Chart-Geschichte: Erfolgreichste Alben der 1980er Jahre“ weiterlesen