R-Zertifizierung: Data Analyst with R Career Track (DataCamp)

Nun ist auch der erste „Career Track“ vollständig: Data Analyst with R.   Seit einiger Zeit fasst DataCamp die Kurse zu Tracks zusammen. Skill Tracks sind spezieller und umfassen weniger Kurse, Career Tracks sind breiter angelegt und umfassen unterschiedliche Themen. Der Data Analyst besteht aus 16 Kursen von Einführung in R über Übungen, Datenimport, Datenaufbereitung, … „R-Zertifizierung: Data Analyst with R Career Track (DataCamp)“ weiterlesen

Informationen visualisieren: Edward Tuftes Klassiker „Envisioning Information“

Wer sich mit Daten-Visualisierung beschäftigt, stößt früher oder später auf den Namen Edward Tufte. Der US-amerikanische Informations-wissenschaftler und Grafikdesigner hat einige Klassiker veröffentlicht, u. a. Visual Display of Quantitative Information und Beautiful Evidence. Hier möchte ich mich mit Envisioning Information* beschäftigen, das mir kürzlich geschenkt wurde. Envisioning Information: Worum geht es Edward Tufte? Envisioning Information, das … „Informationen visualisieren: Edward Tuftes Klassiker „Envisioning Information““ weiterlesen

R-Zertifizierung: Data Manipulation with R Track (DataCamp)

Dritter „Skill Track“ abgeschlossen: Datenaufbereitung mit R (Data Manipulation with R). Er umfasst vier Kurse. Zwei fehlten mir zuletzt noch: Exploratory Data Analysis in R: Case Study (Explorative Datenanalyse: Fallbeispiel) sowie Joining Data in R with dplyr. Darin ging es ausführlich um verschiedene Möglichkeiten, Daten zusammenzuführen bzw. anhand anderer Daten zu filtern. Wer schon seit … „R-Zertifizierung: Data Manipulation with R Track (DataCamp)“ weiterlesen

R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)

Nun ist auch der zweite „Skill Track“ komplett: Importing & Cleaning Data with R (Datenimport und Datenbereinigung in R). Die beiden Kurse zu „Cleaning Data in R“ (Methoden und Praxisbeispiele) hatte ich schon früher absolviert, dazu einen Kurs zu „Importing Data in R“. Dieser alte Kurs wurde durch zwei neue, ausführlichere ersetzt. Auch in den … „R-Zertifizierung: Importing & Cleaning Data with R Track (DataCamp)“ weiterlesen

R-Zertifizierung: R Programming Track (DataCamp)

Seit knapp 1,5 Jahren bin ich bei DataCamp registriert. In dieser Zeit wurde das Kursangebot erheblich erweitert. Zwischenzeitlich hatte ich mal einen großen Teil der Kurse absolviert – inzwischen sind sehr viele neue hinzugekommen. Aber nicht nur Kurse – auch der Aufbau des Kursangebots wurde besser strukturiert. Seit nicht allzu langer Zeit gibt es „Tracks“, … „R-Zertifizierung: R Programming Track (DataCamp)“ weiterlesen

R Zertifizierung: ggplot2 – 3. Kurs

Kürzlich konnte ich den dritten Kurs zu Hadley Wickhams ggplot2-Paket bei DataCamp abschließen. Diesen empfand ich als etwas Besonderes: bereits nach dem zweiten Kurs ist man in der Lage, eine Vielzahl professioneller Diagramme zu erstellen. Dennoch hat sich diese Vertiefung mehr als gelohnt.   Nach einer kurzen Auffrischung ging es u. a. um folgende Themen: Dichteplots … „R Zertifizierung: ggplot2 – 3. Kurs“ weiterlesen

Gastbeitrag: Siegchancen bei „Schlag den Star“ – eine stochastische Analyse

In dem Fernsehformat Schlag den Star treten zwei Prominente in 15 verschiedenen und zuvor unbekannten Spielen gegeneinander an. Das Punktesystem bei Schlag den Star sieht für jedes Spiel eine linear ansteigende Zahl an Wertungspunkten vor. Erhält der Sieger des ersten Spieles einen Punkt, kann der Gewinner des zweiten Spieles zwei Punkte auf sein Punktekonto verbuchen. … „Gastbeitrag: Siegchancen bei „Schlag den Star“ – eine stochastische Analyse“ weiterlesen

Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)

Sind Sie gelangweilt von Standard-Excel-Diagrammen in Präsentationen, Berichten oder Abschlussarbeiten? Hier ein paar Beispiele, die mit der freien Statistik-Software R erstellt wurden, und zwar mit Hadley Wickhams ggplot2-Paket (sofern nicht anders angegeben). Beispiele für Boxplots mit Untergruppen Eine besondere Stärke von R besteht im sog. „faceting“: man kann Diagramme für Untergruppen elegant anordnen. Wer schon mal … „Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)“ weiterlesen

R Zertifizierung: Funktionen programmieren – Writing functions in R (DataCamp, Hadley und Charlotte Wickham)

Learning from the best: Dieser DataCamp-Kurs wurde tatsächlich von Hadley Wickham selbst entwickelt, zusammen mit seiner Schwester Charlotte Wickham. Die allermeisten R-Anwender werden schon nach kurzer Zeit auf den Namen Hadley Wickham stoßen, hat er doch zahlreiche R-Erweiterungs-Pakete programmiert (er soll bereits an 55 Paketen mitgewirkt haben! Tendenz steigend), darunter einige der Bekanntesten: ggplot2, dplyr, … „R Zertifizierung: Funktionen programmieren – Writing functions in R (DataCamp, Hadley und Charlotte Wickham)“ weiterlesen

R Zertifizierung: Machine Learning Toolbox (DataCamp)

Nach einer Phase intensiverer Projektarbeit schaute ich nach längerer Zeit mal wieder bei DataCamp rein: Dort wurde inzwischen das Kursangebot erheblich erweitert. Einer der etwas neueren Kurse heißt Machine Learning Toolbox, rund um das caret-Paket, gelehrt vom Haupt-Entwickler Max Kuhn sowie dem Co-Autor Zachary (Zach) Mayer. Es geht um Supervised Learning, „überwachtes Lernen“: Modelle, die auf eine … „R Zertifizierung: Machine Learning Toolbox (DataCamp)“ weiterlesen