Machine Learning-Algorithmen verstehen: Interaktionseffekte

Machine Learning-Algorithmen zu verstehen ist eine Herausforderung. Mit dem folgenden Text möchte ich einen Beitrag dazu leisten, indem ich ein Spezialthema betrachte: Wie gehen verschiedene Machine Learning-Algorithmen mit Interaktionseffekten um? Folgende Machine-Learning-Algorithmen werden betrachtet: Lineare Regression GAM = Generalized Additive Model KNN = K nächste Nachbarn = k nearest neighbors Ein einzelner Entscheidungsbaum (rpart) Ein … „Machine Learning-Algorithmen verstehen: Interaktionseffekte“ weiterlesen

R-Zertifizierung: Data Analysis and Statistical Inference

Weitere R-Zertifzierung abgeschlossen: Data Analysis and Statistical Inference Der Kurs bei DataCamp bezieht sich auf einen Kurs bei Coursera. Da die Themen mir nicht neu waren, hatte ich wenig Mühe, die Aufgaben auch ohne Teilnahme bei Coursera zu lösen. Nach einer Einführung in R ging es um folgende Themen: Datentypen, Teildatensätze, Boxplots, Histogramme Wahrscheinlichkeiten, Simulationen (z. B. … „R-Zertifizierung: Data Analysis and Statistical Inference“ weiterlesen

Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?

Das Konfidenzintervall ist ein Vertrauensbereich: mit der angegebenen Wahrscheinlichkeit liegt der „wahre“ Wert in diesem Bereich. Bei metrischen Variablen dürften Konfidenzintervalle üblicher und vertrauter sein als bei kategorialen. So liefert SPSS beispielsweise beim t-Test für unabhängige Stichproben das 95%-Konfidenzintervall der Differenz automatisch mit. Doch wie sieht es aus bei kategorialen Variablen? Nehmen wir als Beispiel … „Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?“ weiterlesen