Große Datenmengen visualisieren mit R, ggplot2 und trelliscopejs

Datenvisualisierung: Wie kann man große Datenmengen in R so darstellen, dass sie gut lesbar sind und viele Informationen preisgeben? „Große Datenmengen“ verstehen wir hier im Sinne von „viele Untergruppen“, nicht unbedingt im Sinne von vielen Gigabyte. Wer versiert ist, denkt vielleicht an eine Shiny App, die große Flexibilität und viele Nutzereinstellungen erlaubt. Wir suchen heute … „Große Datenmengen visualisieren mit R, ggplot2 und trelliscopejs“ weiterlesen

Storytelling mit R und ggplot2: Länderfinanzausgleich

ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzausgleich. Unter Storytelling verstehe ich hier: Bestimmte Aspekte hervorheben, die ich als Bearbeiter wichtig finde, um den Blick … „Storytelling mit R und ggplot2: Länderfinanzausgleich“ weiterlesen

Länderfinanzausgleich: 30 Jahre in einer animierten Grafik (1988 – 2018)

Wie kann man die Beträge, die die Bundesländer im Rahmen des Länderfinanzausgleichs zahlten oder erhielten, in einer Grafik darstellen, sodass Veränderungen im Zeitverlauf deutlich werden? Hier eine animierte Grafik, die den Zeitraum von 1988, also kurz vor der Wende, bis 2018 abbildet: Länderfinanzausgleich: Entwicklungen 1988 bis 2018 In diesen 30 Jahren gab es mehrere spannende … „Länderfinanzausgleich: 30 Jahre in einer animierten Grafik (1988 – 2018)“ weiterlesen

Animierte Visualisierungen: Treemaps zum US-Haushaltsdefizit und zum Strommix in Deutschland

Manche Kennzahlen in unserer verrückten Welt wachsen exponentiell. In vielen Fällen zählen Staatsschulden und Haushaltsdefizite dazu. Oft werden solche Zusammenhänge in Liniendiagrammen dargestellt. Hier möchte ich eine alternative Darstellung vorschlagen: animierte Treemaps. Anstieg des US-Haushaltsdefizits nach Präsident: Animierte Treemap Hier geht es um einen visuellen Eindruck davon, wie stark das US-Haushaltsdefizit in den letzten Jahren … „Animierte Visualisierungen: Treemaps zum US-Haushaltsdefizit und zum Strommix in Deutschland“ weiterlesen

Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)

Regressionsmodelle sind nach wie vor sehr populär in der Statistik, dem Data Mining, Data Science und Machine Learning – das belegen aktuelle Zahlen, die KDNuggets kürzlich via Twitter präsentierte: Heute geht es um Möglichkeiten, solche Modelle mit der frei erhältlichen Software R / RStudio zu visualisieren. Wir nutzen den weit verbreiteten Datensatz mtcars, der in … „Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)“ weiterlesen

R-Zertifizierung: Visualisierungen mit R (Data Visualization with R Skill Track, DataCamp)

Weiterer Skill Track abgeschlossen: Datenvisualisierung mit R. Der letzte noch fehlende Kurs war der zum Grafikpaket Lattice.   Der Lattice-Kurs war klasse: DataCamp ist es gelungen, den Experten schlechthin als Kursgeber zu gewinnen – den Programmierer des Lattice-Pakets selbst, Deepayan Sarkar. Nach der Einführung in einige grundlegende Plot-Funktionen (Histogramme, Streudiagramme, Dichte-Diagramme, Boxplots) ging es schnell … „R-Zertifizierung: Visualisierungen mit R (Data Visualization with R Skill Track, DataCamp)“ weiterlesen

Datenvisualisierung: Edward Tuftes Klassiker „Envisioning Information“

Wer sich mit Datenvisualisierung beschäftigt, stößt früher oder später auf den Namen Edward Tufte. Der US-amerikanische Informations-wissenschaftler und Grafikdesigner hat einige Klassiker veröffentlicht, u. a. Visual Display of Quantitative Information und Beautiful Evidence. Hier möchte ich mich mit Envisioning Information* beschäftigen, das mir kürzlich geschenkt wurde. Envisioning Information: Worum geht es Edward Tufte? Envisioning Information, … „Datenvisualisierung: Edward Tuftes Klassiker „Envisioning Information““ weiterlesen

R Zertifizierung: ggplot2 – 3. Kurs

Kürzlich konnte ich den dritten Kurs zu Hadley Wickhams ggplot2-Paket bei DataCamp abschließen. Diesen empfand ich als etwas Besonderes: bereits nach dem zweiten Kurs ist man in der Lage, eine Vielzahl professioneller Diagramme zu erstellen. Dennoch hat sich diese Vertiefung mehr als gelohnt.   Nach einer kurzen Auffrischung ging es u. a. um folgende Themen: Dichteplots … „R Zertifizierung: ggplot2 – 3. Kurs“ weiterlesen

Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)

Sind Sie gelangweilt von Standard-Excel-Diagrammen in Präsentationen, Berichten oder Abschlussarbeiten? Hier ein paar Beispiele, die mit der freien Statistik-Software R erstellt wurden, und zwar mit Hadley Wickhams ggplot2-Paket (sofern nicht anders angegeben). Beispiele für Boxplots mit Untergruppen Eine besondere Stärke von R besteht im sog. „faceting“: man kann Diagramme für Untergruppen elegant anordnen. Wer schon mal … „Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)“ weiterlesen

Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)

Finden Sie statische Diagramme langweilig? Die freie Statistik-Software R bietet verschiedene Möglichkeiten, Diagramme interaktiv zu gestalten. Die einfachere Variante besteht darin, HTML in Verbindung mit Javascript einzusetzen. Hier eine Heatmap, die die Leistung verschiedener Standorte im Hinblick auf diverse Prüfkriterien visualisiert. Die interaktive Version wurde auf eine separate Seite gelegt und ist per Klick erreichbar. … „Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)“ weiterlesen