R-Schulungen

Maßgeschneiderte R-Schulungen

  • Wolf RieplAlle Seminare als Video-Schulung / Webinar möglich
  • Praxisbeispiele zu Ihren Fragestellungen, nach Absprache speziell für Ihre Anwendungsfälle vorbereitet
  • Ihr Wunschtermin, gern bei Ihnen vor Ort
  • Inhalte / Module frei vereinbar
  • Unbürokratische Unterstützung zwischen Schulungsterminen möglich
  • Alle Seminare auf Wunsch auf Englisch
  • Gern erstelle ich ein individuelles Angebot!

Workshops mit festen Terminen beim it Trainingshaus Dresden:

Andere Standorte / Termine auf Anfrage: IT-Schulungen.com

Selbstverständnis:

„Als Sozialwissenschaftler geht es mir um verständliche Interpretationen: Statistik ist kein Selbstzweck, sondern ein Mittel, um Fragen zu beantworten. Bei meinen Schulungen verwende ich anschauliche Praxisbeispiele und verzichte auf mathematische Herleitungen und Formeln.“

  • Boxplots mit Datenpunkten
    Boxplots mit zusätzlicher Darstellung der einzelnen Datenpunkte

Beispiele für Seminare und Module:

Einführung in R / RStudio

  • Benutzeroberfläche, Konsole, Skriptfenster, Umgebung (Environment)
  • Datentypen, Objekte, Verknüpfungen, logische Operatoren
  • Arbeiten mit Datensätzen, Datenimport und -export mit verschiedenen Dateiformaten (.csv, .txt, .xlsx, andere Statistikpakete wie SPSS, SAS, Stata; optional XML), Datenaufbereitung, Umgang mit Fehlwerten etc.
  • Einfache Datenanalysen
  • Einführung in Visualisierungen mit R (kurz zu Base R; ggplot2)
  • Empfehlungen zu sinnvollen R-Paketen, insbesondere aus dem tidyverse:
    Einführung in dplyr und piping %>% für besser lesbaren Code
  • Einführung in Berichtserstellung mit R Markdown
  • Empfohlene Seminardauer: 2 Tage;
    nach Absprache kombinierbar mit einer Einführung in Machine Learning / Data Mining
    und/oder einer Vertiefung der Visualisierungen
  • Empfohlene Seminardauer: 2 Tage
  • Mehr zu diesem Workshop
  • Data Scientist with R Career Track
    Umfasst 23 Kurse: von Grundlagen über Datenimport, Datenaufbereitung über Programmierung und Visualisierung bis zu Statistik und Machine Learning (Supervised und Unsupervised) sowie Text Mining und Berichtslegung

Weitere Zertifizierungen sind in Arbeit: siehe DataCamp-Profil

Machine Learning und Data Mining mit R

Während das Data Mining vorrangig auf die Ableitung von Erkenntnissen aus vorhandenen Daten abzielt, geht es beim Maschinellen Lernen mehr um Vorhersagen, d. h. die Anwendung der zuvor trainierten Modelle auf neue Daten. Die Methoden überschneiden sich zum Teil.

Der Kurs ist in zwei Hauptthemen unterteilt: Supervised Learning und Unsupervised Learning. Beim Supervised Learning gibt es eine Zielvariable, d. h. ein bekanntes „Ergebnis“. Beispiele sind Wohnungspreise („Regressionsproblem“) oder die Information, ob ein Bankkredit bedient wurde oder ausgefallen ist („Klassifikationsproblem“). Es werden Modelle erstellt, die diese Zielgröße bei neuen Daten vorhersagen können. Die Modelle lassen sich daran messen, wie genau bzw. zuverlässig diese Vorhersage gelingt.

Beim Unsupervised Learning gibt es hingegen keine Zielgröße. Hier geht es darum, Muster in den Daten zu finden. Beispiele sind eine Kundensegmentierung oder die Dimensionsreduktion einer großen Anzahl Merkmale auf wenige übergeordnete Komponenten. Schließlich betrachten wir Verbindungen zwischen Methoden des Unsupervised Learning und Supervised Learning.

Wir beschäftigen uns mit regressionsbasierten Methoden, ausgehend von der linearen Regression, die wir auf die Modellierung nichtlinearer Zusammenhänge erweitern. Weiter beschäftigen wir uns mit nichtparametrischen Modellen, die keine funtionale Form des Zusammenhangs schätzen, sowie mit Kriterien der Modellgüte und Kriterien, die uns die Entscheidung zwischen verschiedenen Algorithmen erleichtern.

Empfohlene Seminardauer: 3 Tage

Mehr zu diesem Workshop

R-Programmierung für Fortgeschrittene

Schwerpunkte:

  • Funktionales Programmieren
  • Fehlerbehebung: Debugging in RStudio
  • Effizient programmieren in R
    • Code-Laufzeiten messen
    • R-Code optimieren
    • Mehrere Prozessorkerne / Arbeiter parallelisieren
  • Einführung in objektorientiertes Programmieren mit R (S3-Klassen)
    Programmierbeispiel mit einfacher Spiel-Simulation und benutzerdefinierter Print-Methode
  • Eigene R-Pakete erstellen in RStudio
    Moderne Hilfspakete nutzen, die die Paketerstellung unterstützen (devtools, usethis, testthat)
  • Optional: Tidy Evaluation: Programmieren mit dem tidyverse

Empfohlene Seminardauer: 3 Tage

Mehr zu diesem Workshop

Neu: Eigene R-Pakete erstellen

  • Warum und wann ist es sinnvoll, ein eigenes R-Paket zu erstellen?
  • Ein erstes Paket in fünf Minuten
  • Eigene Funktionen erstellen, ins Paket integrieren und dokumentieren
    Hilfe zu Funktionen erstellen
    DESCRIPTION und NAMESPACE verwalten
    Unterschiede zwischen dem Arbeiten mit R-Skripten und der Paket-Erstellung
    Vignetten erstellen
  • Daten in Pakete integrieren und dokumentieren
  • Checks und Tests
  • Hinweise zur Verteilung / Veröffentlichung von R-Paketen

Empfohlene Seminardauer: 1 Tag

Mehr zu diesem Workshop

Professionelle Diagramme mit ggplot2

Beispiele mit öffentlich zugänglichen Daten. Auf Wunsch gern spezielle Daten von Ihnen, um die Beispiele auf Ihre Anwendungsfälle zuzuschneiden.

  • Kurze Einführung in die „Grammar of Graphics“, die „Grammatik der grafischen Darstellung“
  • Die drei Basisschichten: Daten, Ästhetiken, Geometrien
  • Schnelle Diagramme mit qplot
  • Die Syntax von ggplot2 – Diagrammbeispiele
  • Einführung in tidy data (Datenformat für ggplot2)
  • Diagramme für Untergruppen
  • Statistische Transformationen, z. B. Trendlinien
  • Koordinatensysteme
  • Themes, benutzerdefinierte Anpassungen
  • optional: Einführung in Diagramme für webbasierte Berichte: HTML mit Mouse-Over-Effekten
  • optional: Animationen

Empfohlene Seminardauer: 2 Tage

Mehr zu diesem Workshop

Weitere Seminare / Module auf Anfrage – ich freue mich auf Ihre Nachricht!

Empfehlenswerte Ressourcen

Einführung in R

Statistik und Datenanalyse mit R

Fortgeschrittene Themen