Das R-Paket data.table erweitert die „klassischen“ R-Datensätze (data.frame) mit zwei wesentlichen Zielen: die Programmierzeit bei der Entwicklung von R-Code zu reduzieren sowie die Laufzeit des R-Codes zu verkürzen. Man kann die Funktionalität zwar mit Standard-R ebenfalls erreichen, allerdings oftmals umständlicher und mit mehr Programmzeilen. Nicht verwunderlich, dass sich data.table wachsender Beliebtheit erfreut.
Diesen Kurs fand ich etwas anspruchsvoller als die bisherigen. Die Aufgaben gehen des öfteren über die Erläuterungen in den (gut verständlichen) Videos hinaus.
Der Kurs teilt sich in drei Abschnitte: für Anfänger, Fortgeschrittene und Experten. Inhalte unter anderem:
- Einführung in das data.table-Format
- Auswahl von Zeilen (Fällen) und Spalten (Variablen)
- Gruppierung mit by
- Chaining: Befehle verketten
- .SD, .SDcols; Zuweisungen mit :=
- set, setnames, setcolorder
- Keys
- Rolling joins
Wer persönliche, speziell auf die eigenen Bedürfnisse und auf Wunsch die eigenen Daten zugeschnittene R-Schulungen möchte, kann sich gern an mich wenden.