Machine Learning mit R und caret: GBM optimieren (Gradient Boosting Machine)

Das Maschinelle Lernen vereinigt Methoden aus unterschiedlichen Fachbereichen. Während Ansätze der klassischen Statistik eher auf Hypothesentests ausgelegt sind, steht beim Data Mining oft die Ableitung von praxisrelevanten Erkenntnissen aus vorhandenen Daten im Vordergrund, und das Machine Learning zielt auf die Anwendung der „trainierten“ Modelle auf zuvor nicht gesehene Daten – sprich Vorhersagen. Bei den jeweils … „Machine Learning mit R und caret: GBM optimieren (Gradient Boosting Machine)“ weiterlesen

Studie: Befragung zum subjektiven Signifikanzniveau

Der Untersuchungsgegenstand der folgenden Studie ist die wissenschaftliche Konvention des 5%-Signifikanzniveaus. Vorliegende Signifikanz per se weist lediglich darauf hin, dass eine anfangs aufgestellte Hypothese (mit einer gewissen statistischen Sicherheit) keine Gültigkeit besitzt. Häufig erfolgt die Beweisführung hier durch einen Widerspruch (lat.: reductio ad absurdum). Daher weist eine verworfene Hypothese darauf hin, dass die widersprüchliche Annahme … „Studie: Befragung zum subjektiven Signifikanzniveau“ weiterlesen

Fachchinesisch: einseitig

Der Begriff einseitig ist in der Alltagssprache wohl bekannt; ein Satz wie dieser dürfte für Deutschsprachige leicht verständlich sein: Optimisten sind ebenso einseitig wie Pessimisten – aber sie sind glücklicher. (Dank an spruchfun.de) Der Statistiker denkt eher an einseitige und zweiseitige Signifikanztests. Mit einseitigen Tests werden gerichtete Hypothesen geprüft, mit zweiseitigen ungerichtete Hypothesen. Beispiel für eine … „Fachchinesisch: einseitig“ weiterlesen

ad hoc und post hoc

Ad hoc ist aus der Alltagssprache geläufig. Dieser lateinische Ausdruck heißt übersetzt „zur Sache passend“ oder „für diesen Augenblick gemacht“. Im übertragenen Sinn geht es um improvisierte Handlungen oder spontan aus einer Situation heraus Entstandenes. In der Marktforschung ist der Begriff positiv belegt; so wirbt beispielsweise die GfK Kynetec, die zur renommierten GfK-Gruppe gehört, mit … „ad hoc und post hoc“ weiterlesen

Signifikanz

Ähnlich wie der Begriff Repräsentativität ist auch der Begriff Signifikanz nur sinnvoll anwendbar, wenn ein statistisches Ergebnis aus einer Stichprobe auf eine Grundgesamtheit verallgemeinert werden soll. Statistische Signifikanz liegt dann vor, wenn die Irrtumswahrscheinlichkeit nicht über einem festgelegten Niveau liegt. Findet man z. B. einen positiven Zusammenhang (Korrelation) zwischen Alter und Einkommen (je älter ein … „Signifikanz“ weiterlesen

Fehler: Alltagsverständnis und Statistik

„Fehler“ ist ein Beispiel dafür, dass Fachbegriffe oft von der Bedeutung desselben Begriffs der Alltagssprache abweichen. Da dieses Thema etwas trocken ist, möchte ich es wenigstens mit einem Chuck-Norris-Spruch einleiten: Das einzige Mal, als Chuck Norris sich in seinem Leben irrte, war, als er dachte, er hätte einen Fehler gemacht. In der Statistik werden verschiedene Arten von … „Fehler: Alltagsverständnis und Statistik“ weiterlesen