Machine Learning und Data Mining mit R

Details zu den Algorithmen, mit denen wir uns in diesem Seminar beschäftigen:

Überwachtes Lernen / Supervised Learning für Regressions- und Klassifikationsprobleme

  • Lineare Regression mit kontinuierlichen und kategorialen Prädiktoren
  • algorithmen-basierte Modelloptimierung / automatisierte Auswahl von Prädiktoren (best subsets, forward, backward)
  • logistische Regression
  • Lasso und Ridge-Regression
  • Interaktionseffekte
  • GAM (generalized additive model)
  • KNN (k nearest neighbors)
  • Entscheidungsbäume (decision trees)
  • SVM (Support Vector Machine)
  • Random Forest
  • GBM (Gradient Boosting Machine)
Gradient Boosting Machine mit Interaktionseffekten

Unüberwachtes Lernen / Unsupervised Learning

  • Clusteranalysen: k-means
  • hierarchische Clusteranalysen
  • Dimensionsreduktion, Principal Components Analysis (PCA)
  • PCA als Vorstufe für Regressionsanalysen; PCR (Principal Components Regression) und PLS (Partial Least Squares)

Maschinelles Lernen leicht gemacht: Das R-Paket caret (Max Kuhn)

  • Überanpassung (Overfitting) vermeiden: Kreuzvalidierung
  • Uneinheitlichen R-Code für eine Vielzahl von Machine Learning-Algorithmen handhaben: eine gemeinsame Schnittstelle mit einheitlicher Syntax
  • Modellvergleiche, Gütekriterien; Modell-Optimierung (tuning)

Empfohlene Seminardauer: 3 Tage. Je nach Vorkenntnissen bzw. bei Auswahl von Teilgebieten sind auch kompaktere Seminare möglich.

Hinweis: Folgende Teilgebiete des Maschinellen Lernens werden nicht betrachtet: Reinforcement Learning, Deep Learning

Ich freue mich auf Ihre Nachricht!

Zurück zu R-Schulungen: Übersicht über Seminare / Workshops / Module