R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)

R Zertifizierung abgeschlossen: Daten importieren und aufbereiten – Fallbeispiele. Hier gab es im Vergleich zu bisherigen DataCamp-Kursen nichts Wesentlich Neues – dieser Kurs ist sehr praxisorientiert. Datenbereinigung ist nicht so spektakulär wie das Entwickeln fortgeschrittener DataMining-Modelle, aber oft sehr zeitaufwändig. R-Pakete zur Datenbereinigung und Datenaufbereitung Neben etlichen Basisfunktionen kamen überwiegend Pakete von Hadley Wickham zum … „R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)“ weiterlesen

Excel-Datensätze in R laden: Geschwindigkeits-Test verschiedener R-Pakete

Welche Möglichkeiten gibt es, große Excel-Datensätze schnell in R zu laden? Wir verwenden einen Beispiel-Datensatz mit 29 Variablen (Spalten) und 2.000 bzw. 10.000 Zeilen (Fällen). Das R-Paket gdata Als ich zum ersten Mal Exceldaten in R laden wollte, stieß ich auf das gdata-Paket. Es bietet zahlreiche Erweiterungen der R-Basisfunktionalität. Zum Import von Exceldaten wandelt es die … „Excel-Datensätze in R laden: Geschwindigkeits-Test verschiedener R-Pakete“ weiterlesen

R-Zertifizierung: Data Analysis in R, the data.table Way (DataCamp)

Das R-Paket data.table erweitert die „klassischen“ R-Datensätze (data.frame) mit zwei wesentlichen Zielen: die Programmierzeit bei der Entwicklung von R-Code zu reduzieren sowie die Laufzeit des R-Codes zu verkürzen. Man kann die Funktionalität zwar mit Standard-R ebenfalls erreichen, allerdings oftmals umständlicher und mit mehr Programmzeilen. Nicht verwunderlich, dass sich data.table wachsender Beliebtheit erfreut. Diesen Kurs fand … „R-Zertifizierung: Data Analysis in R, the data.table Way (DataCamp)“ weiterlesen