R-Programmierung: Was ist %>% ? dplyr vs. Base R

Was bedeutet die sonderbar anmutende Zeichenkombination %>% , die man seit ein paar Jahren häufig in R-Skripten findet? Woher kommt sie und wie können wir sie nutzen, um eleganteren und besser lesbaren R-Code zu schreiben? R und moderne Kunst: René Magritte R inspiriert uns mit %>% , wenigstens einen kurzen Abstecher in die moderne Kunst … „R-Programmierung: Was ist %>% ? dplyr vs. Base R“ weiterlesen

Elegante R-Programmierung mit purrr::map und genisteten Datensätzen

2016 machte Hadley Wickham eine Idee populär, von der er zunächst selbst nicht sicher war, ob sie gut ist: genistete Datensätze (nested data frames). Das Prinzip ist einfach: Eine Spalte eines Datensatzes kann selbst ein Datensatz sein. Was zunächst umständlich oder verwirrend klingt, kann zum mächtigen Werkzeug werden – vor allem, wenn man viele gleich … „Elegante R-Programmierung mit purrr::map und genisteten Datensätzen“ weiterlesen

Objektorientiertes Programmieren mit R: S3-Klassen

Die Open-Source-Software R ist ein großartiges Werkzeug zur Datenanalyse. Zahlreiche statistische Verfahren und Visualisierungen können mit wenigen Codezeilen erstellt werden. Dafür steht eine Vielzahl an Funktionen zur Verfügung. Funktionales Programmieren und Objektorientiertes Programmieren Automatisiert man solche Analysen, so bewegt man sich im Bereich des Funktionalen Programmierens. Für Datenanalysen ist das eine gute Wahl. Liegt der … „Objektorientiertes Programmieren mit R: S3-Klassen“ weiterlesen

R lernen mit Hands-On Programming with R von Garrett Grolemund

Wer R lernen will, hat eine Vielzahl von Büchern zur Auswahl – zumindest, wenn englischsprachige Bücher in Frage kommen. Es gibt auch auf Deutsch einige Einführungen (z. B. R kompakt von Daniel Wollschläger), doch der englischsprachige Markt ist deutlich größer. Eine sehr praxisorientierte Einführung stammt von Garrett Grolemund: Hands-On Programming with R. Garrett Grolemund arbeitet … „R lernen mit Hands-On Programming with R von Garrett Grolemund“ weiterlesen

Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)

Regressionsmodelle sind nach wie vor sehr populär in der Statistik, dem Data Mining, Data Science und Machine Learning – das belegen aktuelle Zahlen, die KDNuggets kürzlich via Twitter präsentierte: Heute geht es um Möglichkeiten, solche Modelle mit der frei erhältlichen Software R / RStudio zu visualisieren. Wir nutzen den weit verbreiteten Datensatz mtcars, der in … „Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly)“ weiterlesen

10 Gründe, RStudio zu verwenden

RStudio ist nicht umsonst eine sehr populäre Entwicklungsumgebung für die freie Software R für Statistik, Datenaufbereitung, Data Mining und Machine Learning. 10 Gründe, RStudio zu nutzen – vielleicht ist auch für erfahrene RStudio-Anwender noch eine Überraschung dabei: 1. Sehr informative, übersichtliche Arbeitsumgebung Die Arbeitsumgebung ist in vier Bereiche unterteilt, die jeweils durch Reiter zusätzlichen Platz … „10 Gründe, RStudio zu verwenden“ weiterlesen

R-Zertifizierung: Data Analyst with R Career Track (DataCamp)

Nun ist auch der erste „Career Track“ vollständig: Data Analyst with R.   Seit einiger Zeit fasst DataCamp die Kurse zu Tracks zusammen. Skill Tracks sind spezieller und umfassen weniger Kurse, Career Tracks sind breiter angelegt und umfassen unterschiedliche Themen. Der Data Analyst besteht aus 16 Kursen von Einführung in R über Übungen, Datenimport, Datenaufbereitung, … „R-Zertifizierung: Data Analyst with R Career Track (DataCamp)“ weiterlesen

R-Zertifizierung: Data Manipulation with R Track (DataCamp)

Dritter „Skill Track“ abgeschlossen: Datenaufbereitung mit R (Data Manipulation with R). Er umfasst vier Kurse. Zwei fehlten mir zuletzt noch: Exploratory Data Analysis in R: Case Study (Explorative Datenanalyse: Fallbeispiel) sowie Joining Data in R with dplyr. Darin ging es ausführlich um verschiedene Möglichkeiten, Daten zusammenzuführen bzw. anhand anderer Daten zu filtern. Wer schon seit … „R-Zertifizierung: Data Manipulation with R Track (DataCamp)“ weiterlesen

R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)

Nun ist auch der zweite „Skill Track“ komplett: Importing & Cleaning Data with R (Datenimport und Datenbereinigung in R). Die beiden Kurse zu „Cleaning Data in R“ (Methoden und Praxisbeispiele) hatte ich schon früher absolviert, dazu einen Kurs zu „Importing Data in R“. Dieser alte Kurs wurde durch zwei neue, ausführlichere ersetzt. Auch in den … „R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)“ weiterlesen

R Zertifizierung: ggplot2 – 3. Kurs

Kürzlich konnte ich den dritten Kurs zu Hadley Wickhams ggplot2-Paket bei DataCamp abschließen. Diesen empfand ich als etwas Besonderes: bereits nach dem zweiten Kurs ist man in der Lage, eine Vielzahl professioneller Diagramme zu erstellen. Dennoch hat sich diese Vertiefung mehr als gelohnt.   Nach einer kurzen Auffrischung ging es u. a. um folgende Themen: Dichteplots … „R Zertifizierung: ggplot2 – 3. Kurs“ weiterlesen