R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)

Nun ist auch der zweite „Skill Track“ komplett: Importing & Cleaning Data with R (Datenimport und Datenbereinigung in R). Die beiden Kurse zu „Cleaning Data in R“ (Methoden und Praxisbeispiele) hatte ich schon früher absolviert, dazu einen Kurs zu „Importing Data in R“. Dieser alte Kurs wurde durch zwei neue, ausführlichere ersetzt. Auch in den … „R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)“ weiterlesen

R-Zertifizierung: R Programming Track (DataCamp)

Seit knapp 1,5 Jahren bin ich bei DataCamp registriert. In dieser Zeit wurde das Kursangebot erheblich erweitert. Zwischenzeitlich hatte ich mal einen großen Teil der Kurse absolviert – inzwischen sind sehr viele neue hinzugekommen. Aber nicht nur Kurse – auch der Aufbau des Kursangebots wurde besser strukturiert. Seit nicht allzu langer Zeit gibt es „Tracks“, … „R-Zertifizierung: R Programming Track (DataCamp)“ weiterlesen

R Zertifizierung: Machine Learning Toolbox (DataCamp)

Nach einer Phase intensiverer Projektarbeit schaute ich nach längerer Zeit mal wieder bei DataCamp rein: Dort wurde inzwischen das Kursangebot erheblich erweitert. Einer der etwas neueren Kurse heißt Machine Learning Toolbox, rund um das caret-Paket, gelehrt vom Haupt-Entwickler Max Kuhn sowie dem Co-Autor Zachary (Zach) Mayer. Es geht um Supervised Learning, „überwachtes Lernen“: Modelle, die auf eine … „R Zertifizierung: Machine Learning Toolbox (DataCamp)“ weiterlesen

R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)

R Zertifizierung abgeschlossen: Daten importieren und aufbereiten – Fallbeispiele. Hier gab es im Vergleich zu bisherigen DataCamp-Kursen nichts Wesentlich Neues – dieser Kurs ist sehr praxisorientiert. Datenbereinigung ist nicht so spektakulär wie das Entwickeln fortgeschrittener DataMining-Modelle, aber oft sehr zeitaufwändig. R-Pakete zur Datenbereinigung und Datenaufbereitung Neben etlichen Basisfunktionen kamen überwiegend Pakete von Hadley Wickham zum … „R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)“ weiterlesen

R-Zertifizierung: Data Analysis in R, the data.table Way (DataCamp)

Das R-Paket data.table erweitert die „klassischen“ R-Datensätze (data.frame) mit zwei wesentlichen Zielen: die Programmierzeit bei der Entwicklung von R-Code zu reduzieren sowie die Laufzeit des R-Codes zu verkürzen. Man kann die Funktionalität zwar mit Standard-R ebenfalls erreichen, allerdings oftmals umständlicher und mit mehr Programmzeilen. Nicht verwunderlich, dass sich data.table wachsender Beliebtheit erfreut. Diesen Kurs fand … „R-Zertifizierung: Data Analysis in R, the data.table Way (DataCamp)“ weiterlesen

R-Zertifizierung: dplyr (DataCamp)

Hadley Wickham ist vielleicht der bekannteste Entwickler von R-Paketen; plyr und dplyr dürften zu den populärsten R-Paketen zählen. In diesem Kurs ging es u. a. um folgende Themen: Einführung in dplyr und die Klasse tbls Befehle („verbs“): select, mutate, filter, arrange, summarise Komplexe / verschachtelte Befehle vereinfachen mit %>% (pipe operator) group_by Einsatz von dplyr zur … „R-Zertifizierung: dplyr (DataCamp)“ weiterlesen

R-Zertifizierung: Daten in R importieren (DataCamp)

Weitere R-Zertifizierung abgeschlossen: Importing Data into R Datenimport – klingt langweilig? Heutzutage gibt es eine Vielzahl an Datenformaten, und insbesondere der Umgang mit Daten aus dem Internet kann durchaus herausfordernd sein. In dem Kurs ging es u. a. um folgende Themen: Import von Dateien in den Formaten csv und txt R-Pakete (packages): utils, readr, data.table; … „R-Zertifizierung: Daten in R importieren (DataCamp)“ weiterlesen

R-Zertifizierung: Data Analysis and Statistical Inference

Weitere R-Zertifzierung abgeschlossen: Data Analysis and Statistical Inference Der Kurs bei DataCamp bezieht sich auf einen Kurs bei Coursera. Da die Themen mir nicht neu waren, hatte ich wenig Mühe, die Aufgaben auch ohne Teilnahme bei Coursera zu lösen. Nach einer Einführung in R ging es um folgende Themen: Datentypen, Teildatensätze, Boxplots, Histogramme Wahrscheinlichkeiten, Simulationen (z. B. … „R-Zertifizierung: Data Analysis and Statistical Inference“ weiterlesen

Die ersten R-Zertifizierungen: Einführung in R, Intermediate R – Datacamp

Zeit, das R-Wissen zu zertifizieren. Hier die ersten beiden: DataCamp: Introduction to R / Einführung in R Da ich mich schon einige Zeit mit R beschäftigt hatte, war der Einführungskurs schnell absolviert. Es ging u. a. um folgende Themen: R als Rechner Variablenzuweisungen, Datentypen Vektoren und Matrizen Faktoren und Datensätze Listen Zweiter Kurs: Intermediate R … „Die ersten R-Zertifizierungen: Einführung in R, Intermediate R – Datacamp“ weiterlesen