T-Test oder U-Test?

Bei Mittelwertvergleichen steht der Forscher oft vor der Frage, ob parametrische Verfahren wie der t-Test eingesetzt werden können oder ob auf nichtparametrische Tests wie den Mann-Whitney-U-Test ausgewichen werden muss. Parametrische Verfahren weisen eine höhere Teststärke auf, d. h. sie können tatsächlich vorhandene Unterschiede eher nachweisen, da sie mehr Informationen in den Daten nutzen. Ihr Nachteil … „T-Test oder U-Test?“ weiterlesen

Fachchinesisch: einseitig

Der Begriff einseitig ist in der Alltagssprache wohl bekannt; ein Satz wie dieser dürfte für Deutschsprachige leicht verständlich sein: Optimisten sind ebenso einseitig wie Pessimisten – aber sie sind glücklicher. (Dank an spruchfun.de) Der Statistiker denkt eher an einseitige und zweiseitige Signifikanztests. Mit einseitigen Tests werden gerichtete Hypothesen geprüft, mit zweiseitigen ungerichtete Hypothesen. Beispiel für eine … „Fachchinesisch: einseitig“ weiterlesen

ad hoc und post hoc

Ad hoc ist aus der Alltagssprache geläufig. Dieser lateinische Ausdruck heißt übersetzt „zur Sache passend“ oder „für diesen Augenblick gemacht“. Im übertragenen Sinn geht es um improvisierte Handlungen oder spontan aus einer Situation heraus Entstandenes. In der Marktforschung ist der Begriff positiv belegt; so wirbt beispielsweise die GfK Kynetec, die zur renommierten GfK-Gruppe gehört, mit … „ad hoc und post hoc“ weiterlesen

CRISP-DM: Ein Standard-Prozess-Modell für Data Mining

CRISP-DM steht für CRoss-Industry Standard Process for Data Mining. Dieses branchenübergreifende Prozess-Modell wurde ab 1996 im Rahmen eines EU-Förderprojekts entwickelt, und zwar von so namhaften Teilnehmern wie DaimlerChrysler (damals noch Daimler-Benz) und SPSS (damals ISL). Es ist nicht eigentumsrechtlich geschützt. Update: Der neuere Standard heißt ASUM-DM (Analytics Solutions Unified Method for Data Mining/Predictive Analytics). Es … „CRISP-DM: Ein Standard-Prozess-Modell für Data Mining“ weiterlesen

Scheinkorrelation vs. intervenierende Variable

In anderen Artikeln habe ich bereits auf Scheinkorrelationen hingewiesen, z. B. den statistischen Klassiker: Je mehr Störche es in einer Region gibt, desto mehr Kinder gibt es dort auch. Typisch für eine Scheinkorrelation ist: betrachtet man lediglich den Zusammenhang zwischen zwei Variablen, ohne auf weitere Merkmale zu achten, so ist dieser statistisch bedeutsam. Die Gültigkeit … „Scheinkorrelation vs. intervenierende Variable“ weiterlesen

Gewichtung mit SPSS Syntaxbeispiel

Nehmen wir an, bei einer Umfrage haben 70% Frauen und 30% Männer teilgenommen. In der Grundgesamtheit (z. B. Gesamtbevölkerung) sind die Geschlechter jedoch gleichmäßig verteilt, also 50/50. Möchte man nun eine Gleichverteilung erreichen, so kann man den Datensatz gewichten. Männer werden etwas höher gewichtet, Frauen etwas niedriger. Eine Häufigkeitsverteilung mit aktivierter Gewichtung zeigt dann das … „Gewichtung mit SPSS Syntaxbeispiel“ weiterlesen

SPSS Syntaxbeispiel: Schleifen

Aufgabe: Aus 10 Variablen Rohwert1 bis Rohwert10 sollen 10 neue Variablen berechnet werden, z. B. normierte Werte Normbereich1 bis Normbereich10. Die Umformungsvorschrift laute: Rohwerte von 0-10 erhalten Normbereich 1, Werte von 11-15 Normbereich 2, Werte von 16 bis 18 Normbereich 3. Einfache Lösung: Viele SPSS-Befehle an einander reihen: if Rohwert1 < 11 Normbereich1 = 1. if Rohwert1 >10 … „SPSS Syntaxbeispiel: Schleifen“ weiterlesen

Faktor / Faktoren

Faktor in der Alltagssprache Der Begriff Faktor ist aus der Alltagssprache geläufig. Z. B. lese ich in einem empfehlenswerten Zeit-Artikel von Harald Martenstein, „Die Taktik des Beleidigens“, den Satz: „Man kann sagen, dass Beleidigungen im Fußball ein spielentscheidender Faktor geworden sind.“ (Hinweis auf das WM-Finale 2006 und Zidanes Platzverweis.) Ein Faktor ist somit eine Ursache, … „Faktor / Faktoren“ weiterlesen

SPSS Syntaxbeispiel: Makros für Regressionsanalysen

Aufgabenstellung: Eine Reihe von Einzelregressionen mit jeweils einer unabhängigen Variablen berechnen. Einfache Lösung: Für jede unabängige Variable die Regressionssyntax anlegen. Z. B. so: REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV1. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV2. Und so weiter … „SPSS Syntaxbeispiel: Makros für Regressionsanalysen“ weiterlesen

Signifikanz

Ähnlich wie der Begriff Repräsentativität ist auch der Begriff Signifikanz nur sinnvoll anwendbar, wenn ein statistisches Ergebnis aus einer Stichprobe auf eine Grundgesamtheit verallgemeinert werden soll. Statistische Signifikanz liegt dann vor, wenn die Irrtumswahrscheinlichkeit nicht über einem festgelegten Niveau liegt. Findet man z. B. einen positiven Zusammenhang (Korrelation) zwischen Alter und Einkommen (je älter ein … „Signifikanz“ weiterlesen