30 Jahre: Meilensteine der Programmiersprache R

Vor gut 30 Jahren wurde die Programmiersprache R veröffentlicht. Geschichte im Überblick: Meilensteine wie CRAN, UseR, ggplot2, ROpenSci, dplyr, R-Ladies, Shiny, tidyverse, Tidy Tuesday, Quarto, Posit, WebR, Positron, …

Vor gut 30 Jahren wurde die Programmiersprache R veröffentlicht. Geschichte im Überblick: Meilensteine wie CRAN, UseR, ggplot2, ROpenSci, dplyr, R-Ladies, Shiny, tidyverse, Tidy Tuesday, Quarto, Posit, WebR, Positron, …

6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht

Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Lebensstilen und Ernährungsverhalten von Jugendlichen und … „6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht“ weiterlesen

Datenvisualisierung: Fundamentals of Data Visualization von Claus O. Wilke

2019 legte Claus O. Wilke mit Fundamentals of Data Visualization ein sehr lesenswertes Buch über Datenvisualisierung vor, das einige Vorzüge gegenüber vergleichbaren Werken bietet: Wer es gerne physisch in Papierform in der Hand hält, kann es selbstverständlich käuflich erwerben. Es steht jedoch auch kostenlos online im Volltext zur Verfügung. Damit folgt es dem Beispiel von … „Datenvisualisierung: Fundamentals of Data Visualization von Claus O. Wilke“ weiterlesen

R und Shiny: Was ist Reaktivität / Reaktives Programmieren?

Der Erfolg von Datenanalysen beruht nicht nur auf den Ergebnissen selbst, sondern zunehmend auch darauf, wie sie präsentiert und anderen zugänglich gemacht werden. R bietet mit Shiny ein großartiges Werkzeug, um interaktive Webapplikationen zu erstellen. Dazu sind weder HTML- noch CSS- oder Javascript-Kenntnisse erforderlich. Shiny: Umdenken von bisheriger R-Programmierung Wer bereits Erfahrungen mit der R-Programmierung … „R und Shiny: Was ist Reaktivität / Reaktives Programmieren?“ weiterlesen

Fehlwerte visualisieren in R: Das naniar-Paket

Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket von Nicholas Tierney bietet dafür sehr praktische Funktionen und ist eng mit dem … „Fehlwerte visualisieren in R: Das naniar-Paket“ weiterlesen

Balkendiagramme erstellen in Base R und mit ggplot2 – Gast-Video von Joachim Schork / Statistics Globe

Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe – Dank an Joachim!

Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe – Dank an Joachim!

Statistische Gruppenvergleiche in R elegant visualisieren: ggstatsplot

Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.

Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.

Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie

Zeitreihenanalyse ist ein Spezialthema, das in R von spezialisierten Paketen abgedeckt wurde und wird.  So entstand eine Nische, die sich weitgehend unabhängig von neueren R-Paketen zur Datenanalyse entwickelte. tidyquant von Matt Dancho und Davis Vaughan baut eine Brücke zwischen zeitreihen-spezifischen Paketen wie quantmod, xts, zoo, PerformancAnalytics und TTR einerseits sowie dem tidyverse andererseits mit Paketen … „Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie“ weiterlesen

ggplot2: Die vier fortgeschrittenen Schichten

Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.

Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.

ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien

ggplot2 ist der de-facto-Standard, um professionelle, ansprechende Grafiken in R zu erstellen. Heute sehen wir uns die drei Basisschichten an, die für jede ggplot2-Grafik erforderlich sind. ggplot2 basiert auf der Grammatik der grafischen Darstellung (Grammar of Graphics), die auf Leland Wilkinson zurückgeht. Er beschrieb das Konzept unabhängig von R in seinem Buch von 1999 (siehe … „ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien“ weiterlesen