SQL-Datenbanken mit R ansprechen: Drei Strategien

R bietet mehrere Möglichkeiten, mit Datenbanken zu kommunizieren. Dieser Artikel richtet sich sowohl an R-Anwender, die noch nicht von R aus mit Datenbanken gearbeitet haben, als auch an solche, die dies bereits tun, aber bisher nur eine Möglichkeit genutzt haben. So kann jedeR den Ansatz auswählen, der für den jeweiligen Anwendungsfall am besten passt. Strategien … „SQL-Datenbanken mit R ansprechen: Drei Strategien“ weiterlesen

Fehlwerte visualisieren in R: Das naniar-Paket

Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket von Nicholas Tierney bietet dafür sehr praktische Funktionen und ist eng mit dem … „Fehlwerte visualisieren in R: Das naniar-Paket“ weiterlesen

Balkendiagramme erstellen in Base R und mit ggplot2 – Gast-Video von Joachim Schork / Statistics Globe

Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe – Dank an Joachim!

Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe – Dank an Joachim!

Eigene R-Pakete erstellen: Gast-Video auf Statistics Globe

Vor kurzem erhielt ich eine Anfrage von Joachim Schork, ob ich mir eine Zusammenarbeit zwischen unseren Youtube-Kanälen Statistics Globe und StatistikinDD vorstellen kann. Darüber freute ich mich sehr – es wurde die erste Collab im Kontext meines Youtube-Kanals. In meinem Beitrag auf Statistics Globe geht es um die Erstellung eigener R-Pakete. Eigene R-Pakete erstellen: Warum … „Eigene R-Pakete erstellen: Gast-Video auf Statistics Globe“ weiterlesen

Statistik mit R leicht gemacht: Der R Commander – eine grafische Oberfläche

Wer neu mit Datenanalysen in R beginnt oder von anderen Statistik-Programmen kommt, mag es als Hürde empfinden, dass man nun Befehle kennen und eintippen muss. Doch es gibt Abhilfe in Form von grafischen Oberflächen. Eine davon ist der R Commander, mit dem man sich statistische Tests „zusammenklicken“ kann. Man erhält R-Code, mit dem man anschließend … „Statistik mit R leicht gemacht: Der R Commander – eine grafische Oberfläche“ weiterlesen

Statistische Gruppenvergleiche in R elegant visualisieren: ggstatsplot

Man kann viel Zeit damit verbringen, statistische Grafiken publikationsfähig aufzubereiten. Standard-Darstellungen von Gruppenvergleichen enthalten keine statistischen Informationen: z. B. eine Kennzeichnung, welche von mehreren Gruppen sich statistisch signifikant unterscheiden, oder Details zu den verwendeten Tests. ggstatsplot: Informative Grafiken mit sehr wenig Aufwand! Hier kommt das ggstatsplot-Paket von Indrajeet Patil ins Spiel: Man kann mit sehr … „Statistische Gruppenvergleiche in R elegant visualisieren: ggstatsplot“ weiterlesen

Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie

Zeitreihenanalyse ist ein Spezialthema, das in R von spezialisierten Paketen abgedeckt wurde und wird.  So entstand eine Nische, die sich weitgehend unabhängig von neueren R-Paketen zur Datenanalyse entwickelte. tidyquant von Matt Dancho und Davis Vaughan baut eine Brücke zwischen zeitreihen-spezifischen Paketen wie quantmod, xts, zoo, PerformancAnalytics und TTR einerseits sowie dem tidyverse andererseits mit Paketen … „Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie“ weiterlesen

Fortschrittsbalken anzeigen und Code parallelisieren in R: progressr und future

Heute will ich zwei Fliegen mit einer Klappe schlagen: Einen Fortschrittsbalken in R implementieren R-Code parallel ausführen (d. h. auf mehreren Prozessorkernen gleichzeitig) R-Pakete: progressr und future Für die Umsetzung des Fortschrittsbalkens habe ich mich für progressr von Henrik Bengtsson entschieden. Es bietet eine leistungsfähige API (Schnittstelle), sodass man nicht nur im Paket enthaltene Fortschrittsbalken … „Fortschrittsbalken anzeigen und Code parallelisieren in R: progressr und future“ weiterlesen

ggplot2: Die vier fortgeschrittenen Schichten

Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.

Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.

ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien

ggplot2 ist der de-facto-Standard, um professionelle, ansprechende Grafiken in R zu erstellen. Heute sehen wir uns die drei Basisschichten an, die für jede ggplot2-Grafik erforderlich sind. ggplot2 basiert auf der Grammatik der grafischen Darstellung (Grammar of Graphics), die auf Leland Wilkinson zurückgeht. Er beschrieb das Konzept unabhängig von R in seinem Buch von 1999 (siehe … „ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien“ weiterlesen