Hadley Wickham ist vielleicht der bekannteste Entwickler von R-Paketen; plyr und dplyr dürften zu den populärsten R-Paketen zählen.
In diesem Kurs ging es u. a. um folgende Themen:
- Einführung in dplyr und die Klasse tbls
- Befehle („verbs“): select, mutate, filter, arrange, summarise
- Komplexe / verschachtelte Befehle vereinfachen mit %>% (pipe operator)
- group_by
- Einsatz von dplyr zur Arbeit mit Datenbanken:
Ist eine Datenbankverbindung hergestellt, können die dplyr-Befehle ebenso angewendet werden wie auf Datensätze, die sich ganz im Arbeitsspeicher befinden; man muss also die Befehle nicht selbst in SQL „übersetzen“