R Zertifizierung: Visualisierungen mit R (Data Visualization with R Skill Track, DataCamp)

Weiterer Skill Track abgeschlossen: Datenvisualisierung mit R. Der letzte noch fehlende Kurs war der zum Grafikpaket Lattice.   Der Lattice-Kurs war klasse: DataCamp ist es gelungen, den Experten schlechthin als Kursgeber zu gewinnen – den Programmierer des Lattice-Pakets selbst, Deepayan Sarkar. Nach der Einführung in einige grundlegende Plot-Funktionen (Histogramme, Streudiagramme, Dichte-Diagramme, Boxplots) ging es schnell … „R Zertifizierung: Visualisierungen mit R (Data Visualization with R Skill Track, DataCamp)“ weiterlesen

Informationen visualisieren: Edward Tuftes Klassiker „Envisioning Information“

Wer sich mit Daten-Visualisierung beschäftigt, stößt früher oder später auf den Namen Edward Tufte. Der US-amerikanische Informations-wissenschaftler und Grafikdesigner hat einige Klassiker veröffentlicht, u. a. Visual Display of Quantitative Information und Beautiful Evidence. Hier möchte ich mich mit Envisioning Information* beschäftigen, das mir kürzlich geschenkt wurde. Envisioning Information: Worum geht es Edward Tufte? Envisioning Information, das … „Informationen visualisieren: Edward Tuftes Klassiker „Envisioning Information““ weiterlesen

R Zertifizierung: ggplot2 – 3. Kurs

Kürzlich konnte ich den dritten Kurs zu Hadley Wickhams ggplot2-Paket bei DataCamp abschließen. Diesen empfand ich als etwas Besonderes: bereits nach dem zweiten Kurs ist man in der Lage, eine Vielzahl professioneller Diagramme zu erstellen. Dennoch hat sich diese Vertiefung mehr als gelohnt.   Nach einer kurzen Auffrischung ging es u. a. um folgende Themen: Dichteplots … „R Zertifizierung: ggplot2 – 3. Kurs“ weiterlesen

Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)

Sind Sie gelangweilt von Standard-Excel-Diagrammen in Präsentationen, Berichten oder Abschlussarbeiten? Hier ein paar Beispiele, die mit der freien Statistik-Software R erstellt wurden, und zwar mit Hadley Wickhams ggplot2-Paket (sofern nicht anders angegeben). Beispiele für Boxplots mit Untergruppen Eine besondere Stärke von R besteht im sog. „faceting“: man kann Diagramme für Untergruppen elegant anordnen. Wer schon mal … „Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)“ weiterlesen

Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)

Finden Sie statische Diagramme langweilig? Die freie Statistik-Software R bietet verschiedene Möglichkeiten, Diagramme interaktiv zu gestalten. Die einfachere Variante besteht darin, HTML in Verbindung mit Javascript einzusetzen. Hier eine Heatmap, die die Leistung verschiedener Standorte im Hinblick auf diverse Prüfkriterien visualisiert. Die interaktive Version wurde auf eine separate Seite gelegt und ist per Klick erreichbar. … „Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)“ weiterlesen

Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?

Balken- und Säulendiagramme werden immer noch häufig verwendet, um Mittelwertsunterschiede darzustellen – obwohl zumindest in Fachkreisen schon viel Kritik an diesem Diagrammtyp geäußert wurde. Für einen schnellen optischen Eindruck mag es passen – oder auch nicht. Der Mittelwert allein ist nur ein Aspekt einer Verteilung. Hier ein Beispiel: require(ggplot2) ggplot(daten) + aes(x = Geschlecht, y … „Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?“ weiterlesen

R Zertifizierung: R Markdown – DataCamp

Da ich schon mit R Markdown gearbeitet hatte, war mir in diesem Kurs nicht alles neu:   Themen waren unter anderem: Einführung in die Markup-Sprache Markdown (auch HTML ist eine Markup-Sprache; Markdown ist speziell für R-Anwender und wesentlich einfacher und besser lesbar) Mischen von Text, R-Code, Ergebnissen von statistischen Berechnungen sowie Diagrammen Einbau von LaTeX-Formeln … „R Zertifizierung: R Markdown – DataCamp“ weiterlesen

R-Zertifizierung: ggvis – DataCamp

Neuer und weniger bekannt als ggplot2 ist das R-Paket ggvis. Es basiert ebenfalls auf der grammar of graphics, d. h. die Diagramme werden in Schichten aufgebaut, die sehr flexibel anpassbar sind. ggvis verbindet die Stärken von ggplot2 mit shiny und vega. Die Verknüpfung mit shiny ermöglicht interaktive Grafiken. Auch an diesem Paket hat Hadley Wickham … „R-Zertifizierung: ggvis – DataCamp“ weiterlesen

R-Zertifizierung: ggplot2 (2) – DataCamp

Damit ist der Fortsetzungskurs zum ersten Teil von Hadley Wickhams ggplot2-Paket ebenfalls abgeschlossen:   Hier ging es über rein beschreibende Darstellungen hinaus, indem auch statistische Funktionen in die Plots einbezogen wurden: u. a. Mittelwerte, Standardabweichungen, Konfidenzintervalle, Quantile, Residuen von Chi-Quadrat-Tests sowie lineare Modelle mit Glättungsfunktionen (Loess-Smoother). Ein eigenes Kapitel widmete sich „Best Practices“ speziell zu … „R-Zertifizierung: ggplot2 (2) – DataCamp“ weiterlesen

R-Zertifizierung: ggplot2 (1) – DataCamp

Das ggplot2-Paket von Hadley Wickham berücksichtigt die Grammar of Graphics, die „Grammatik grafischer Darstellungen“, und ist in mancherlei Hinsicht dem Base-System von R überlegen. So werden Grafiken in „Schichten“ (Layers) aufgebaut und sind damit wesentlich flexibler handhabbar. Und – schlicht ausgedrückt – sie sehen in aller Regel deutlich professioneller aus. Der erste ggplot-Kurs behandelte die … „R-Zertifizierung: ggplot2 (1) – DataCamp“ weiterlesen