SPSS Modeler: Merkmalsauswahl (Feature Selection)

In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen

Signifikant: Gummibärchen verursachen Akne

Wird ein signifikantes Studienergebnis veröffentlicht, so flößt das vielen Menschen Respekt ein – völlig zu Recht natürlich. Es erhält damit die höheren Weihen wissenschaftlicher Unabweisbarkeit. Eine Möglichkeit, einen signifikanten Zusammenhang (Korrelation) zu entdecken, zeigt hier mein Lieblings-Webcomic xkcd (leider und, Dank des feinen Humors, zugleich glücklicher Weise auf englisch): man testet einfach so lange so … „Signifikant: Gummibärchen verursachen Akne“ weiterlesen

Fachchinesisch: einseitig

Der Begriff einseitig ist in der Alltagssprache wohl bekannt; ein Satz wie dieser dürfte für Deutschsprachige leicht verständlich sein: Optimisten sind ebenso einseitig wie Pessimisten – aber sie sind glücklicher. (Dank an spruchfun.de) Der Statistiker denkt eher an einseitige und zweiseitige Signifikanztests. Mit einseitigen Tests werden gerichtete Hypothesen geprüft, mit zweiseitigen ungerichtete Hypothesen. Beispiel für eine … „Fachchinesisch: einseitig“ weiterlesen

Signifikanz

Ähnlich wie der Begriff Repräsentativität ist auch der Begriff Signifikanz nur sinnvoll anwendbar, wenn ein statistisches Ergebnis aus einer Stichprobe auf eine Grundgesamtheit verallgemeinert werden soll. Statistische Signifikanz liegt dann vor, wenn die Irrtumswahrscheinlichkeit nicht über einem festgelegten Niveau liegt. Findet man z. B. einen positiven Zusammenhang (Korrelation) zwischen Alter und Einkommen (je älter ein … „Signifikanz“ weiterlesen