Vor kurzem erhielt ich eine Anfrage von Joachim Schork, ob ich mir eine Zusammenarbeit zwischen unseren Youtube-Kanälen Statistics Globe und StatistikinDD vorstellen kann. Darüber freute ich mich sehr – es wurde die erste Collab im Kontext meines Youtube-Kanals. In meinem Beitrag auf Statistics Globe geht es um die Erstellung eigener R-Pakete. Eigene R-Pakete erstellen: Warum … „Eigene R-Pakete erstellen: Gast-Video auf Statistics Globe“ weiterlesen
Statistik-Blog
Statistik mit R leicht gemacht: Der R Commander – eine grafische Oberfläche
Wer neu mit Datenanalysen in R beginnt oder von anderen Statistik-Programmen kommt, mag es als Hürde empfinden, dass man nun Befehle kennen und eintippen muss. Doch es gibt Abhilfe in Form von grafischen Oberflächen. Eine davon ist der R Commander, mit dem man sich statistische Tests „zusammenklicken“ kann. Man erhält R-Code, mit dem man anschließend … „Statistik mit R leicht gemacht: Der R Commander – eine grafische Oberfläche“ weiterlesen
Statistische Gruppenvergleiche in R elegant visualisieren: ggstatsplot
Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.
Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.
Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie
Zeitreihenanalyse ist ein Spezialthema, das in R von spezialisierten Paketen abgedeckt wurde und wird. So entstand eine Nische, die sich weitgehend unabhängig von neueren R-Paketen zur Datenanalyse entwickelte. tidyquant von Matt Dancho und Davis Vaughan baut eine Brücke zwischen zeitreihen-spezifischen Paketen wie quantmod, xts, zoo, PerformancAnalytics und TTR einerseits sowie dem tidyverse andererseits mit Paketen … „Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie“ weiterlesen
Fortschrittsbalken anzeigen und Code parallelisieren in R: progressr und future
Heute will ich zwei Fliegen mit einer Klappe schlagen: Einen Fortschrittsbalken in R implementieren R-Code parallel ausführen (d. h. auf mehreren Prozessorkernen gleichzeitig) R-Pakete: progressr und future Für die Umsetzung des Fortschrittsbalkens habe ich mich für progressr von Henrik Bengtsson entschieden. Es bietet eine leistungsfähige API (Schnittstelle), sodass man nicht nur im Paket enthaltene Fortschrittsbalken … „Fortschrittsbalken anzeigen und Code parallelisieren in R: progressr und future“ weiterlesen
ggplot2: Die vier fortgeschrittenen Schichten
Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.
Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.
ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien
ggplot2 ist der de-facto-Standard, um professionelle, ansprechende Grafiken in R zu erstellen. Heute sehen wir uns die drei Basisschichten an, die für jede ggplot2-Grafik erforderlich sind. ggplot2 basiert auf der Grammatik der grafischen Darstellung (Grammar of Graphics), die auf Leland Wilkinson zurückgeht. Er beschrieb das Konzept unabhängig von R in seinem Buch von 1999 (siehe … „ggplot2: Einführung in die drei Basisschichten – Daten, Ästhetiken, Geometrien“ weiterlesen
Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen
Der Zehnkampf gilt als die Königsdisziplin der Leichtathletik. Die Internationale Leichtathletik-Mehrkampfwertung der IAAF (International Amateur Athletics Federation) bewertet jede Leistung in den zehn Wettbewerben. Die Leistungen aus zehn Wettbewerben werden aggregiert und zu einer Punktzahl zusammengefasst. Die aktuelle Wertungstabelle wird international seit 1985 angewandt. Die IAAF-Wettbewerbstabelle basiert auf statistischen Analysen der Leistungen in den Einzeldisziplinen. … „Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen“ weiterlesen
R 4.1.0: Base R Pipe! |>
Am 18.5.2021 wurde R Version 4.1.0 veröffentlicht, und sie brachte (fast) eine Revolution: Einen Pipe Operator, nativ in Base R eingebaut! Pipe Operator in R seit 2014: magrittr / dplyr Mit dem magrittr-Paket wurde 2014 der Pipe-Operator %>% in R zur Verfügung gestellt. Er hat sich rasch durchgesetzt und erfreut sich sehr großer Beliebtheit. Viele … „R 4.1.0: Base R Pipe! |>“ weiterlesen
Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende
Was spricht gegen Powerpoint, wenn es darum geht, Ergebnisse von Datenanalysen zu präsentieren? Hier geht es mir um drei Aspekte: Automatisierung und Reproduzierbarkeit, Dateiformate, Dateigrößen. Powerpoint ist nicht schlecht! Es geht mir überhaupt nicht darum, Powerpoint schlecht zu machen. Ich halte es für ein großartiges Werkzeug. Es ist einfach zu nutzen, gut geeignet für Präsentationen, … „Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende“ weiterlesen