R Zertifizierung: Funktionen programmieren – Writing functions in R (DataCamp, Hadley und Charlotte Wickham)

Learning from the best: Dieser DataCamp-Kurs wurde tatsächlich von Hadley Wickham selbst entwickelt, zusammen mit seiner Schwester Charlotte Wickham. Die allermeisten R-Anwender werden schon nach kurzer Zeit auf den Namen Hadley Wickham stoßen, hat er doch zahlreiche R-Erweiterungs-Pakete programmiert (er soll bereits an 55 Paketen mitgewirkt haben! Tendenz steigend), darunter einige der Bekanntesten: ggplot2, dplyr, … „R Zertifizierung: Funktionen programmieren – Writing functions in R (DataCamp, Hadley und Charlotte Wickham)“ weiterlesen

R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)

R Zertifizierung abgeschlossen: Daten importieren und aufbereiten – Fallbeispiele. Hier gab es im Vergleich zu bisherigen DataCamp-Kursen nichts Wesentlich Neues – dieser Kurs ist sehr praxisorientiert. Datenbereinigung ist nicht so spektakulär wie das Entwickeln fortgeschrittener DataMining-Modelle, aber oft sehr zeitaufwändig. R-Pakete zur Datenbereinigung und Datenaufbereitung Neben etlichen Basisfunktionen kamen überwiegend Pakete von Hadley Wickham zum … „R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)“ weiterlesen

Excel-Datensätze in R laden: Geschwindigkeits-Test verschiedener R-Pakete

Welche Möglichkeiten gibt es, große Excel-Datensätze schnell in R zu laden? Wir verwenden einen Beispiel-Datensatz mit 29 Variablen (Spalten) und 2.000 bzw. 10.000 Zeilen (Fällen). Das R-Paket gdata Als ich zum ersten Mal Exceldaten in R laden wollte, stieß ich auf das gdata-Paket. Es bietet zahlreiche Erweiterungen der R-Basisfunktionalität. Zum Import von Exceldaten wandelt es die … „Excel-Datensätze in R laden: Geschwindigkeits-Test verschiedener R-Pakete“ weiterlesen

R-Zertifizierung: ggvis – DataCamp

Neuer und weniger bekannt als ggplot2 ist das R-Paket ggvis. Es basiert ebenfalls auf der grammar of graphics, d. h. die Diagramme werden in Schichten aufgebaut, die sehr flexibel anpassbar sind. ggvis verbindet die Stärken von ggplot2 mit shiny und vega. Die Verknüpfung mit shiny ermöglicht interaktive Grafiken. Auch an diesem Paket hat Hadley Wickham … „R-Zertifizierung: ggvis – DataCamp“ weiterlesen

R-Zertifizierung: ggplot2 (2) – DataCamp

Damit ist der Fortsetzungskurs zum ersten Teil von Hadley Wickhams ggplot2-Paket ebenfalls abgeschlossen:   Hier ging es über rein beschreibende Darstellungen hinaus, indem auch statistische Funktionen in die Plots einbezogen wurden: u. a. Mittelwerte, Standardabweichungen, Konfidenzintervalle, Quantile, Residuen von Chi-Quadrat-Tests sowie lineare Modelle mit Glättungsfunktionen (Loess-Smoother). Ein eigenes Kapitel widmete sich „Best Practices“ speziell zu … „R-Zertifizierung: ggplot2 (2) – DataCamp“ weiterlesen

R-Zertifizierung: dplyr (DataCamp)

Hadley Wickham ist vielleicht der bekannteste Entwickler von R-Paketen; plyr und dplyr dürften zu den populärsten R-Paketen zählen. In diesem Kurs ging es u. a. um folgende Themen: Einführung in dplyr und die Klasse tbls Befehle („verbs“): select, mutate, filter, arrange, summarise Komplexe / verschachtelte Befehle vereinfachen mit %>% (pipe operator) group_by Einsatz von dplyr zur … „R-Zertifizierung: dplyr (DataCamp)“ weiterlesen