R-Schulungen

Maßgeschneiderte R-Schulungen

  • Wolf RieplPraxisbeispiele zu Ihren Fragestellungen, nach Absprache speziell für Ihre Anwendungsfälle vorbereitet
  • Ihr Wunschtermin, gern bei Ihnen vor Ort
  • Inhalte / Module frei vereinbar
  • Unbürokratische Unterstützung zwischen Schulungsterminen möglich
  • Gern erstelle ich ein individuelles Angebot!

Selbstverständnis:

„Als Sozialwissenschaftler geht es mir um verständliche Interpretationen: Statistik ist kein Selbstzweck, sondern ein Mittel, um Fragen zu beantworten. Bei meinen Schulungen verwende ich anschauliche Praxisbeispiele und verzichte auf mathematische Herleitungen und Formeln.“

  • Säulendiagramm (Dynamite Plot) vs. Punktdiagramm (Dot Plot)
    Säulendiagramme (links) werden häufig für Mittelwertsunterschiede eingesetzt. Informativer sind Punktdiagramme (rechts). Vgl. Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?.

Beispiele für Module:

Modul „Einführung in R / R-Studio“

  • Benutzeroberfläche, Konsole, Skriptfenster, Umgebung (Environment)
  • Datentypen, Objekte, Verknüpfungen, logische Operatoren
  • Arbeiten mit Datensätzen, Datenimport, Datenaufbereitung, Umgang mit Fehlwerten etc.
  • Einfache Datenanalysen
  • Stanford University: Statistical Learning, Certificate
    Stanford University: Statistical Learning (Trevor Hastie, Rob Tibshirani)

Weitere Zertifizierungen sind in Arbeit: siehe DataCamp-Profil

Modul „Deskriptive Statistik und einfache statistische Tests“

  • Verteilungen beschreiben, Kennzahlen, einfache Diagramme
  • Prüfung von Verteilungsannahmen, Normalverteilung
  • Signifikanztests für metrische und kategoriale Merkmale wie t-Test, U-Test, Chi-Quadrat-Test, Anova
  • Korrelation, Scheinkorrelation, verdeckte Korrelation

Module zu speziellen R-Paketen

  • Professionelle Diagramme mit ggplot2
  • Datenbearbeitung mit dplyr und / oder data.table
  • Datenimport mit readr, utils, readxl, gdata, XLConnect, haven, foreign, DBI, RMySQL
  • Berichtserstellung mit markdown (HTML, Word, PDF)
  • Einführung in R Commander (Rcmdr)

Modul „Modellbildung / Maschinelles Lernen“

  • Einfache und multiple lineare Regression
  • Metrische und kategoriale unabhängige Variablen (Prädiktoren)
  • Modellgüte: R², korrigiertes R², Cp, AIC, BIC
  • Trainingsfehler und Testfehler; Über-Anpassung (Overfitting)
  • Kreuzvalidierung
  • Modell-Selektion, z. B. Forward, Backward, Best Subsets
  • Regressionsmodelle für eine große Anzahl von Prädiktoren, z. B. Ridge-Regression, Lasso
  • Dimensionsreduktion: Faktorenanalyse als Vorstufe zur Regressionsanalyse; PCA / PCR / PLS
  • Logistische Regression
  • KNN (K Nearest Neighbor)
  • Entscheidungsbäume / Random Forest

Modul „Unüberwachtes Lernen“ (Unsupervised Learning)

  • Clusteranalysen: Erstellung von Typologien
  • hierarchische und partitionierende Verfahren
  • Methoden zur Bestimmung der Clusteranzahl und zur Beurteilung der Clusterlösung
  • Faktorenanalysen

Weitere Module auf Anfrage – ich freue mich auf Ihre Nachricht!

Empfehlenswerte Ressourcen: