R-Schulungen

Maßgeschneiderte R-Schulungen

  • Alle Seminare als Video-Schulung / Webinar möglich
  • Praxisbeispiele zu Ihren Fragestellungen, nach Absprache speziell für Ihre Anwendungsfälle vorbereitet
  • Ihr Wunschtermin, gern bei Ihnen vor Ort
  • Inhalte / Module frei vereinbar
  • Unbürokratische Unterstützung zwischen Schulungsterminen möglich
  • Alle Seminare auf Wunsch auf Englisch
  • Gern erstelle ich ein individuelles Angebot!

Workshops mit festen Terminen beim it Trainingshaus Dresden:

Andere Standorte / Termine auf Anfrage: IT-Schulungen.com

Selbstverständnis:

„Dank mehrjähriger Seminarerfahrung kann ich mich auf unterschiedliche Hintergründe und Vorkenntnisse einstellen – bei Präsenzseminaren ebenso wie in Webinaren. Mein Ziel ist, dass Sie ebenso viel Freude bei der R-Anwendung erleben wie ich.“

  • Boxplots mit zusätzlicher Darstellung der einzelnen Datenpunkte
  • Gruppierte Streudiagramme (Scatterplots) mit Regressionsgerade und Konfidenzbändern
  • Gruppierte Streudiagramme (Scatterplots) mit nichtlinearer Anpassungskurve (loess) und Konfidenzbändern
  • Regressionsmodell: 3D-Darstellung, Ebene im Raum statt Regressionsgerade; im HTML-Format interaktiv möglich (Mouse-Over-Effekte, drehen und zoomen)
  • Umfasst 23 Kurse: von Grundlagen über Datenimport, Datenaufbereitung über Programmierung und Visualisierung bis zu Statistik und Machine Learning (Supervised und Unsupervised) sowie Text Mining und Berichtslegung
  • Gruppierte Histogramme, gefärbt nach weiterem Merkmal (hier Geschlecht)
  • Streudiagramm (Scatterplot) mit zwei Anpassungsgeraden; Punkte stellen nach Farbe und Form weitere Merkmale dar
  • Entscheidungsbaum (Decision Tree) zum Untergang der Titanic: Wurden Frauen und Kinder zuerst gerettet? Liefert auch für statistische Laien leicht verständliche Ergebnisse
  • Säulendiagramme (links) werden häufig für Mittelwertsunterschiede eingesetzt. Informativer sind Punktdiagramme (rechts). Vgl. Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?.
  • Heatmap statt Mittelwertstabelle (je dunkler, desto besser); als HTML mit Javascript interaktiv (Infos durch Mouse-Over): siehe Interaktive Heatmap (HTML mit Javascript)
  • Korrelationen: Kombination aus Diagramm und Korrelationskoeffizienten; R-Paket "corrplot"
  • Silhouettenplot zur Dresdner Stadtteil-Typologie mit 6 Clustern (kmeans)
  • Typologie Dresdner Stadtteile.
    Methode: kmeans-Clusteranalyse mit 7 Merkmalen (Base R)
  • Bevölkerungsentwicklung Dresden 1830 bis 2013 nach Geschlecht (Base R)
  • Treemap (Baumkarte): Anstieg der US-Schulden nach Präsidenten; die Jahre beziehen sich nicht auf die Amtszeit, sondern die Budgetverantwortung; R-Paket "treemap"

Beispiele für Seminare und Module:

Einführung in R / RStudio

  • Benutzeroberfläche, Konsole, Skriptfenster, Umgebung (Environment)
  • Datentypen, Objekte, Verknüpfungen, logische Operatoren
  • Arbeiten mit Datensätzen, Datenimport und -export mit verschiedenen Dateiformaten (.csv, .txt, .xlsx, andere Statistikpakete wie SPSS, SAS, Stata; optional XML), Datenaufbereitung, Umgang mit Fehlwerten etc.
  • Einfache Datenanalysen
  • Einführung in Visualisierungen mit R (kurz zu Base R; ggplot2)
  • Empfehlungen zu sinnvollen R-Paketen, insbesondere aus dem tidyverse:
    Einführung in dplyr und piping %>% für besser lesbaren Code
  • Einführung in Berichtserstellung mit R Markdown
  • Empfohlene Seminardauer: 2 Tage;
    nach Absprache kombinierbar mit einer Vertiefung der Visualisierungen, der Berichtserstellung oder anderen Themen / Modulen
  • Empfohlene Seminardauer: 2 Tage
  • Mehr zu diesem Workshop
  • Umfasst 23 Kurse: von Grundlagen über Datenimport, Datenaufbereitung über Programmierung und Visualisierung bis zu Statistik und Machine Learning (Supervised und Unsupervised) sowie Text Mining und Berichtslegung
  • Skill Track: Machine Learning with R. Supervised Learning: Regression und Classification; Unsupervised Learning; Machine Learning Toolbox
  • Skill Track: Shiny Fundamentals. Umfasst 3 Kurse: Building Web Applications in R with Shiny: Case Studies; Building Dashboards with shinydashboard; Building Dashboards with flexdashboards
  • Skill Track Big Data with R umfasst folgende Kurse: Writing Efficient R Code, Visualizing Big Data with Trelliscope, Scalable Data Processing, Introduction to Spark with sparklyr, Parallel Programming in R
  • Der "Career Track" umfasst 10 Kurse: Introduction, Intermediate, Intermediate Practice, Importing (2), Cleaning Data, Cleaning (Case Studies), String Manipulation, Writing Functions, Object-Oriented Programming (S3, R6)
  • Career Track: Data Analyst; umfasst 16 Kurse, u. a. Datenimport, Datenaufbereitung (dplyr), Explorative Datenanalyse, Visualisierungen (ggplot2), Statistik, Berichtslegung (RMarkdown)
  • Skill Track: Tidyverse Fundamentals. Umfasst 5 R-Kurse zum tidyverse.
  • Skill Track Data Visualization with R: Enthält 5 Kurse: Drei ggplot2-Kurse, einen Kurs zu Visualisierungen mit Base R und einen zu lattice
  • Statistik mit R umfasst vier Kurse: Introduction to Data, Exploratory Data Analysis, Correlation and Regression, Multiple and Logistic Regression
  • Der "Skill Track" Data manipulation with Rbesteht aus vier Kursen: Data Manipulation in R with dplyr, Exploratory Data Analysis in R: Case Study, Joining Data in R with dplyr sowie Data Analysis in R, the data.table way
  • Skill Track: Importing & Cleaning Data. Umfasst 4 Kurse: Importing Data in R, Teil 1 und 2, Cleaning Data in R, sowie Case Studies.

Weitere Zertifizierungen sind in Arbeit: siehe DataCamp-Profil

R-Programmierung für Fortgeschrittene

Schwerpunkte:

  • Funktionales Programmieren
  • Fehlerbehebung: Debugging in RStudio
  • Effizient programmieren in R
    • Code-Laufzeiten messen
    • R-Code optimieren
    • Mehrere Prozessorkerne / Arbeiter parallelisieren
  • Eigene R-Pakete erstellen in RStudio
    Moderne Hilfspakete nutzen, die die Paketerstellung unterstützen (devtools, usethis, testthat)
  • Optional: Einführung in objektorientiertes Programmieren mit R (S3-Klassen)
    Programmierbeispiel mit benutzerdefinierter Print-Methode
  • Optional: R und externe Datenquellen
    Excel-Daten laden; Excel-Mappen aus R heraus bearbeiten; ungünstig formatierte Excel-Tabellen als R-Datensätze importieren
    Datenbankanbindung mit R: Strategien, Techniken, R-Pakete;
    Visualisierung von Daten in einer Datenbank: dbplot

Empfohlene Seminardauer: 3 Tage

Mehr zu diesem Workshop

Eigene R-Pakete erstellen

R-Pakete bieten eine elegante Möglichkeit, R-Code zu organisieren, zu dokumentieren, über mehrere Projekte hinweg ohne Copy & Paste zu verwenden und die Weiterentwicklung sowie die Nutzbarkeit für Kollegen zu erleichtern.

  • Ein erstes Paket in fünf Minuten
  • Eigene Funktionen erstellen, ins Paket integrieren und dokumentieren
    Hilfe zu Funktionen erstellen
    DESCRIPTION und NAMESPACE verwalten
    Unterschiede zwischen dem Arbeiten mit R-Skripten und der Paket-Erstellung
    Vignetten erstellen
  • Daten in Pakete integrieren und dokumentieren
  • Checks und Tests
  • Hinweise zur Verteilung / Veröffentlichung von R-Paketen

Empfohlene Seminardauer: 1 Tag

Mehr zu diesem Workshop

Datenvisualisierung mit R und ggplot2

  • Kurze Einführung in die „Grammar of Graphics“, die „Grammatik der grafischen Darstellung“
  • Die drei Basisschichten: Daten, Ästhetiken, Geometrien
  • Schnelle Diagramme mit qplot
  • Die Syntax von ggplot2 – Diagrammbeispiele
  • Einführung in tidy data (Datenformat für ggplot2)
  • Diagramme für Untergruppen
  • Statistische Transformationen, z. B. Trendlinien
  • Koordinatensysteme
  • Ausblick: Themes, benutzerdefinierte Anpassungen; Einführung in Diagramme für webbasierte Berichte: HTML mit Mouse-Over-Effekten; Animationen
  • Überblick zu empfohlenen Erweiterungspaketen

Empfohlene Seminardauer: 1 Tag

Mehr zu diesem Workshop

Neu: Ergebnisse berichten mit R – Reproduzierbare Workflows dank Markdown

Mit R Markdown lassen sich wiederkehrende Berichte voll automatisieren – das spart wertvolle Zeit und hilft, Copy & Paste-Fehler zu vermeiden.

  • Grundlagen der Reproduzierbarkeit von Datenanalysen mit R
  • Einführung in das Markdown-Format
  • Ausgabe-Formate: Automatisierte Berichte
    • Word, PDF
    • Präsentationsformate: Mehr als Powerpoint
    • HTML-Berichte: Interaktive Elemente
  • Grafiken, Tabellen, Daten darstellen
  • Flexibilität mit parametrisierten Berichten
    • Unterschiedliche Berichte aus der gleichen Berichtsvorlage (z. B. für verschiedene Teilgruppen / Empfänger)
  • Weitere Markdown-Formate
    • Bücher, Blogs, Dashboards mit R
  • Ausblick auf weiterführende Themen
    • Paket-Empfehlungen für spezielle Berichtsanforderungen
    • Andere Sprachen als R einsetzen
    • Shiny-Apps in Markdown einbetten 

Empfohlene Seminardauer: 1 Tag

Mehr zu diesem Workshop

Weitere Seminare / Module auf Anfrage – ich freue mich auf Ihre Nachricht!

Empfehlenswerte Ressourcen

Einführung in R

Statistik und Datenanalyse mit R

Fortgeschrittene Themen