Maßgeschneiderte R-Schulungen
Alle Seminare als Video-Schulung / Webinar möglich
- Praxisbeispiele zu Ihren Fragestellungen, nach Absprache speziell für Ihre Anwendungsfälle vorbereitet
- Ihr Wunschtermin, gern bei Ihnen vor Ort
- Inhalte / Module frei vereinbar
- Unbürokratische Unterstützung zwischen Schulungsterminen möglich
- Alle Seminare auf Wunsch auf Englisch
- Gern erstelle ich ein individuelles Angebot!
Workshops mit festen Terminen beim it Trainingshaus Dresden:
- Programmieren mit R (2 Tage)
- Datenvisualisuerung mit R und ggplot2 (1 Tag)
- R-Programmierung für Fortgeschrittene (3 Tage)
- Eigene R-Pakete erstellen (1 Tag)
Andere Standorte / Termine auf Anfrage: IT-Schulungen.com
Selbstverständnis:
„Als Sozialwissenschaftler geht es mir um verständliche Interpretationen: Statistik ist kein Selbstzweck, sondern ein Mittel, um Fragen zu beantworten. Bei meinen Schulungen verwende ich anschauliche Praxisbeispiele und verzichte auf mathematische Herleitungen und Formeln.“
Beispiele für Seminare und Module:
Einführung in R / RStudio
- Benutzeroberfläche, Konsole, Skriptfenster, Umgebung (Environment)
- Datentypen, Objekte, Verknüpfungen, logische Operatoren
- Arbeiten mit Datensätzen, Datenimport und -export mit verschiedenen Dateiformaten (.csv, .txt, .xlsx, andere Statistikpakete wie SPSS, SAS, Stata; optional XML), Datenaufbereitung, Umgang mit Fehlwerten etc.
- Einfache Datenanalysen
- Einführung in Visualisierungen mit R (kurz zu Base R; ggplot2)
- Empfehlungen zu sinnvollen R-Paketen, insbesondere aus dem tidyverse:
Einführung in dplyr und piping %>% für besser lesbaren Code - Einführung in Berichtserstellung mit R Markdown
- Empfohlene Seminardauer: 2 Tage;
nach Absprache kombinierbar mit einer Einführung in Machine Learning / Data Mining
und/oder einer Vertiefung der Visualisierungen - Empfohlene Seminardauer: 2 Tage
- Mehr zu diesem Workshop
Weitere Zertifizierungen sind in Arbeit: siehe DataCamp-Profil
Machine Learning und Data Mining mit R
Während das Data Mining vorrangig auf die Ableitung von Erkenntnissen aus vorhandenen Daten abzielt, geht es beim Maschinellen Lernen mehr um Vorhersagen, d. h. die Anwendung der zuvor trainierten Modelle auf neue Daten. Die Methoden überschneiden sich zum Teil.
Der Kurs ist in zwei Hauptthemen unterteilt: Supervised Learning und Unsupervised Learning. Beim Supervised Learning gibt es eine Zielvariable, d. h. ein bekanntes „Ergebnis“. Beispiele sind Wohnungspreise („Regressionsproblem“) oder die Information, ob ein Bankkredit bedient wurde oder ausgefallen ist („Klassifikationsproblem“). Es werden Modelle erstellt, die diese Zielgröße bei neuen Daten vorhersagen können. Die Modelle lassen sich daran messen, wie genau bzw. zuverlässig diese Vorhersage gelingt.
Beim Unsupervised Learning gibt es hingegen keine Zielgröße. Hier geht es darum, Muster in den Daten zu finden. Beispiele sind eine Kundensegmentierung oder die Dimensionsreduktion einer großen Anzahl Merkmale auf wenige übergeordnete Komponenten. Schließlich betrachten wir Verbindungen zwischen Methoden des Unsupervised Learning und Supervised Learning.
Wir beschäftigen uns mit regressionsbasierten Methoden, ausgehend von der linearen Regression, die wir auf die Modellierung nichtlinearer Zusammenhänge erweitern. Weiter beschäftigen wir uns mit nichtparametrischen Modellen, die keine funtionale Form des Zusammenhangs schätzen, sowie mit Kriterien der Modellgüte und Kriterien, die uns die Entscheidung zwischen verschiedenen Algorithmen erleichtern.
Empfohlene Seminardauer: 3 Tage
R-Programmierung für Fortgeschrittene
Schwerpunkte:
- Funktionales Programmieren
- Fehlerbehebung: Debugging in RStudio
- Effizient programmieren in R
- Code-Laufzeiten messen
- R-Code optimieren
- Mehrere Prozessorkerne / Arbeiter parallelisieren
- Einführung in objektorientiertes Programmieren mit R (S3-Klassen)
Programmierbeispiel mit einfacher Spiel-Simulation und benutzerdefinierter Print-Methode - Eigene R-Pakete erstellen in RStudio
Moderne Hilfspakete nutzen, die die Paketerstellung unterstützen (devtools, usethis, testthat) - Optional: Tidy Evaluation: Programmieren mit dem tidyverse
Empfohlene Seminardauer: 3 Tage
Neu: Eigene R-Pakete erstellen
- Warum und wann ist es sinnvoll, ein eigenes R-Paket zu erstellen?
- Ein erstes Paket in fünf Minuten
- Eigene Funktionen erstellen, ins Paket integrieren und dokumentieren
Hilfe zu Funktionen erstellen
DESCRIPTION und NAMESPACE verwalten
Unterschiede zwischen dem Arbeiten mit R-Skripten und der Paket-Erstellung
Vignetten erstellen - Daten in Pakete integrieren und dokumentieren
- Checks und Tests
- Hinweise zur Verteilung / Veröffentlichung von R-Paketen
Empfohlene Seminardauer: 1 Tag
Professionelle Diagramme mit ggplot2
Beispiele mit öffentlich zugänglichen Daten. Auf Wunsch gern spezielle Daten von Ihnen, um die Beispiele auf Ihre Anwendungsfälle zuzuschneiden.
- Kurze Einführung in die „Grammar of Graphics“, die „Grammatik der grafischen Darstellung“
- Die drei Basisschichten: Daten, Ästhetiken, Geometrien
- Schnelle Diagramme mit qplot
- Die Syntax von ggplot2 – Diagrammbeispiele
- Einführung in tidy data (Datenformat für ggplot2)
- Diagramme für Untergruppen
- Statistische Transformationen, z. B. Trendlinien
- Koordinatensysteme
- Themes, benutzerdefinierte Anpassungen
- optional: Einführung in Diagramme für webbasierte Berichte: HTML mit Mouse-Over-Effekten
- optional: Animationen
Empfohlene Seminardauer: 2 Tage
Weitere Seminare / Module auf Anfrage – ich freue mich auf Ihre Nachricht!
Empfehlenswerte Ressourcen
Einführung in R
- R Kompakt: Der Schnelle Einstieg in die Datenanalyse (Springer-Lehrbuch, Daniel Wollschläger)
- Hands on Programming with R (Garrett Grolemund); kostenlos online lesbar
Statistik und Datenanalyse mit R
- R for Data Science, kurz R4DS: kostenlos online lesbar
- Discovering Statistics Using R (Andy Field; humorvoll; englisch)
- The Art of R Programming: A Tour of Statistical Software Design (Norman Matloff; weniger statistisch; „wie tickt R“)
- Statistical Learning: Online-Kurs der Universität Stanford mit den renommierten Professoren Trevor Hastie und Rob Tibshirani
- An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics)
(einfacher als das ältere „Elements of Statistical Learning“)
Fortgeschrittene Themen
- Advanced R von Hadley Wickham. Kostenlos online lesbar. Empfehlung: Zweite Auflage! Deutlich überarbeitet und leichter verständlich als die erste
- Neu: Mastering Shiny von Hadley Wickham. Kostenlos online lesbar