Statistik-Blog

Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen

Der Zehnkampf gilt als die Königsdisziplin der Leichtathletik. Die Internationale Leichtathletik-Mehrkampfwertung der IAAF (International Amateur Athletics Federation) bewertet jede Leistung in den zehn Wettbewerben. Die Leistungen aus zehn Wettbewerben werden aggregiert und zu einer Punktzahl zusammengefasst. Die aktuelle Wertungstabelle wird international seit 1985 angewandt. Die IAAF-Wettbewerbstabelle basiert auf statistischen Analysen der Leistungen in den Einzeldisziplinen. … „Decathlon: Zehnkampf aus statistischer Sicht unter Corona-Bedingungen“ weiterlesen

R 4.1.0: Base R Pipe! |>

Am 18.5.2021 wurde R Version 4.1.0 veröffentlicht, und sie brachte (fast) eine Revolution: Einen Pipe Operator, nativ in Base R eingebaut! Pipe Operator in R seit 2014: magrittr / dplyr Mit dem magrittr-Paket wurde 2014 der Pipe-Operator %>% in R zur Verfügung gestellt. Er hat sich rasch durchgesetzt und erfreut sich sehr großer Beliebtheit. Viele … „R 4.1.0: Base R Pipe! |>“ weiterlesen

Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende

Was spricht gegen Powerpoint, wenn es darum geht, Ergebnisse von Datenanalysen zu präsentieren? Hier geht es mir um drei Aspekte: Automatisierung und Reproduzierbarkeit, Dateiformate, Dateigrößen. Powerpoint ist nicht schlecht! Es geht mir überhaupt nicht darum, Powerpoint schlecht zu machen. Ich halte es für ein großartiges Werkzeug. Es ist einfach zu nutzen, gut geeignet für Präsentationen, … „Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende“ weiterlesen

Diagramm-Erstellung mit ggplot2 beschleunigen: Das ragg-Paket

Diagramme zu erstellen und zu speichern kann viel Zeit in Anspruch nehmen, vor allem bei großen Datenmengen oder wenn sehr viele Diagramme automatisiert zu generieren sind. Wie kann man den Vorgang für Diagramme mit dem beliebten ggplot2-Paket beschleunigen? Das ragg-Paket von Thomas Lin Pedersen Das ragg-Paket von Thomas Lin Pedersen ist eine R-Implementierung der AGG … „Diagramm-Erstellung mit ggplot2 beschleunigen: Das ragg-Paket“ weiterlesen

Als Wessi entlarvt bei einer R-Schulung!

Bei einer R-Schulung wurde ich als Wessi entlarvt in einer Situation, in der ich das absolut nicht erwartet hätte. Es ging ums Runden. Hättet Ihr das gewusst? Habt Ihr ähnliche Überraschungen mit interkulturellen Unterschieden in vermeintlich unverdächtigen Situationen erlebt? Kaufmännisches vs. mathematisches Runden Zu der Zeit hatte ich mich noch nicht weiter mit den Details … „Als Wessi entlarvt bei einer R-Schulung!“ weiterlesen

Diagramme mit Daten aus Datenbanken in R: dbplot

Diagrammerstellung mit großen Datenmengen aus Datenbanken kann herausfordernd sein. Wie geht das möglichst effizient? Ad-hoc-Datenbank im Arbeitsspeicher Wir nutzen Daten über weltweite Chart-Erfolge von Songs und Alben und packen sie in eine Ad-hoc-Datenbank im Arbeitsspeicher. Das genügt, um die Ideen zu demonstrieren, und erspart Aufwand mit der Infrastruktur. Wie effizient die Diagrammerstellung erfolgt, hängt wesentlich … „Diagramme mit Daten aus Datenbanken in R: dbplot“ weiterlesen

R-Projekte vor Paket-Updates schützen: renv

„Never change a running system!“„Ändere nie ein System, das funktioniert!“ In aller Regel ist es eine gute Idee, Software aktuell zu halten: also etwa bei R, RStudio und Erweiterungspaketen Updates mitzunehmen. Manchmal haben Updates jedoch die unangenehme Nebenwirkung, bisher funktionierenden Code zu „brechen“. Beispiel: Interaktives Dashboard funktioniert nicht mehr nach dplyr-Update Im Video zeige ich … „R-Projekte vor Paket-Updates schützen: renv“ weiterlesen

Farbskalen in R auswählen per App: Der Palette Explorer (tmaptools)

Eine Farbskala für eine Datenvisualisierung auszuwählen ist keine triviale Aufgabe. Diese Shiny App von Martijn Tennekes kann eine große, bequeme Hilfe sein. Farbskalen auswählen: Die App starten Die App zur Auswahl von Farbskalen ist im R-Paket tmaptools enthalten. Der Anwender kann entscheiden, ob er das Paket laden oder die App direkt starten möchte. (Voraussetzung ist … „Farbskalen in R auswählen per App: Der Palette Explorer (tmaptools)“ weiterlesen

ggplot2 leicht gemacht: Grafiken per Maus dank esquisse!

ggplot2 ist ein mächtiges Werkzeug, um professionelle Diagramme zu erstellen. Für Einsteiger ist die Syntax nicht immer intuitiv. Abhilfe schafft eine grafische Oberfläche, mit der man Variablen mit der Maus auswählen und in Felder schieben kann („drag and drop“): esquisse. So erhält man schnell aussagekräftige Diagramme und kann Daten visuell erforschen, ohne Programmcode schreiben zu … „ggplot2 leicht gemacht: Grafiken per Maus dank esquisse!“ weiterlesen

Wie man Boxplots in R informativer gestaltet (ggplot2 und mehr)

Boxplots geben einen schnellen Überblick über Verteilungen. Wie kann man sie informativer gestalten als das Standard-Boxplot? Hier geht es um Ideen mit ggplot2 sowie einigen Erweiterungspaketen. Das folgende Video ist mein erstes, das auf einem Storyboard basiert – umgesetzt mit dem flexdashboard-Paket, das eine Erweiterung des R Markdown-Formats darstellt. Schreibt in den Kommentaren, ob Euch … „Wie man Boxplots in R informativer gestaltet (ggplot2 und mehr)“ weiterlesen