Scheinkorrelation vs. intervenierende Variable

In anderen Artikeln habe ich bereits auf Scheinkorrelationen hingewiesen, z. B. den statistischen Klassiker: Je mehr Störche es in einer Region gibt, desto mehr Kinder gibt es dort auch. Typisch für eine Scheinkorrelation ist: betrachtet man lediglich den Zusammenhang zwischen zwei Variablen, ohne auf weitere Merkmale zu achten, so ist dieser statistisch bedeutsam. Die Gültigkeit … „Scheinkorrelation vs. intervenierende Variable“ weiterlesen

Gewichtung mit SPSS Syntaxbeispiel

Nehmen wir an, bei einer Umfrage haben 70% Frauen und 30% Männer teilgenommen. In der Grundgesamtheit (z. B. Gesamtbevölkerung) sind die Geschlechter jedoch gleichmäßig verteilt, also 50/50. Möchte man nun eine Gleichverteilung erreichen, so kann man den Datensatz gewichten. Männer werden etwas höher gewichtet, Frauen etwas niedriger. Eine Häufigkeitsverteilung mit aktivierter Gewichtung zeigt dann das … „Gewichtung mit SPSS Syntaxbeispiel“ weiterlesen

SPSS Syntaxbeispiel: Schleifen

Aufgabe: Aus 10 Variablen Rohwert1 bis Rohwert10 sollen 10 neue Variablen berechnet werden, z. B. normierte Werte Normbereich1 bis Normbereich10. Die Umformungsvorschrift laute: Rohwerte von 0-10 erhalten Normbereich 1, Werte von 11-15 Normbereich 2, Werte von 16 bis 18 Normbereich 3. Einfache Lösung: Viele SPSS-Befehle an einander reihen: if Rohwert1 < 11 Normbereich1 = 1. if Rohwert1 >10 … „SPSS Syntaxbeispiel: Schleifen“ weiterlesen

Faktor / Faktoren

Der Begriff Faktor ist aus der Alltagssprache geläufig. Z. B. lese ich in einem empfehlenswerten Zeit-Artikel von Harald Martenstein, „Die Taktik des Beleidigens“, den Satz: „Man kann sagen, dass Beleidigungen im Fußball ein spielentscheidender Faktor geworden sind.“ (Hinweis auf das WM-Finale 2006 und Zidanes Platzverweis.) Ein Faktor ist somit eine Ursache, die (zusammen mit anderen) … „Faktor / Faktoren“ weiterlesen

Stata do-file: Schleifen

Aufgabenstellung: Setze v2_1 bis v2_10 auf missing, wenn v1=0. Einfache Lösung: 10 Befehle aneinander reihen, z. B. so: replace v2_1=. if v1==0 replace v2_2=. if v1==0 replace v2_3=. if v1==0 … replace v2_10. if v1==0 Eleganter geht es mit einer Schleife: foreach var in v2_* { replace `var’=. if v1==0 } So wird das do-file … „Stata do-file: Schleifen“ weiterlesen

SPSS Syntaxbeispiel: Makros für Regressionsanalysen

Aufgabenstellung: Eine Reihe von Einzelregressionen mit jeweils einer unabhängigen Variablen berechnen. Einfache Lösung: Für jede unabängige Variable die Regressionssyntax anlegen. Z. B. so: REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV1. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT AV /METHOD=enter UV2. Und so weiter … „SPSS Syntaxbeispiel: Makros für Regressionsanalysen“ weiterlesen

Signifikanz

Ähnlich wie der Begriff Repräsentativität ist auch der Begriff Signifikanz nur sinnvoll anwendbar, wenn ein statistisches Ergebnis aus einer Stichprobe auf eine Grundgesamtheit verallgemeinert werden soll. Statistische Signifikanz liegt dann vor, wenn die Irrtumswahrscheinlichkeit nicht über einem festgelegten Niveau liegt. Findet man z. B. einen positiven Zusammenhang (Korrelation) zwischen Alter und Einkommen (je älter ein … „Signifikanz“ weiterlesen

SPSS Modeler: Maschinenlernen vs. Statistische Modelle

Statistische Modelle beruhen auf mathematische Gleichungen, wobei ein Algorithmus die vorgegebenen Parameter schätzt. Moderner und flexibler sind Techniken zum Maschinenlernen. Sie werden auf Basis minimaler Anforderungen an die Modellstruktur und minimalen Annahmen für das Modell berechnet. Die Form der Beziehungen wird während des Lernprozesses bestimmt. Beispiel: Lineare Regression vs. Neuronales Netzwerk (Neural Network) Falls sich … „SPSS Modeler: Maschinenlernen vs. Statistische Modelle“ weiterlesen

Mehrfachantworten

Abteilungsleiter Marktforschung (nimmt sich extra Zeit, setzt einen geduldigen Blick auf): Bei dieser Frage gibt es Mehrfachantworten. Ich habe bisher noch niemanden erlebt, der das beim ersten Mal richtig gemacht hat. Praktikant (hoch motiviert): Ich glaube, ich habe das Prinzip verstanden! Abteilungsleiter: Na, dann legen Sie mal los. Formulieren Sie einen Satz mit den Prozentangaben … „Mehrfachantworten“ weiterlesen

R² in logistischen Regressionsmodellen

Für logistische Regressionsmodelle wurde eine Vielzahl von Gütemaßen entwickelt: z. B. McFadden’s Pseudo-R², McKelvey & Zavoina’s R², ML (Cox-Snell) R², Cragg-Uhler (Nagelkerke) R², nicht adjustiertes Count R², Akaike’s Information Criterion (AIC), Bayesian Information Criterion (BIC). Im Gegensatz zur linearen Regression gibt es jedoch kein Maß mit einer ähnlich eindeutigen Interpretation im Sinne erklärter Varianz, und … „R² in logistischen Regressionsmodellen“ weiterlesen