Gewichtung mit SPSS Syntaxbeispiel

SPSS Logo

Nehmen wir an, bei einer Umfrage haben 70% Frauen und 30% Männer teilgenommen. In der Grundgesamtheit (z. B. Gesamtbevölkerung) sind die Geschlechter jedoch gleichmäßig verteilt, also 50/50. Möchte man nun eine Gleichverteilung erreichen, so kann man den Datensatz gewichten. Männer werden etwas höher gewichtet, Frauen etwas niedriger. Eine Häufigkeitsverteilung mit aktivierter Gewichtung zeigt dann das gewünschte Verhältnis: 50% Frauen, 50% Männer. Wie macht man das? Man benötigt eine Gewichtungsvariable. Der Gewichtungsfaktor wird mit Sollverteilung / Istverteilung berechnet. Syntaxbeispiel:

if geschlecht=“weiblich“ gewicht=50/70.
if geschlecht=“männlich“ gewicht=50/30.
exe.

Aktivieren der Gewichung:
weight by gewicht.

Ausschalten der Gewichtung (z. B. um ungewichtete Fallzahlen zu ermitteln):
weight off.

Problematischer wird es, wenn nach mehreren Merkmalen gleichzeitig gewichtet werden soll. Beispiel: Gewichtung nach Geschlecht, Altersgruppen und höchstem Bildungsabschluss. Am besten kennt man die Sollverteilung für jede Untergruppe, z. B. 31-40jährige Frauen mit Hochschulabschluss. Dann kann man die spezifischen Gewichtungsfaktoren analog zum obigen Beispiel (mit mehreren if-Bedingungen) berechnen. Kennt man die Sollverteilungen nur für jedes Merkmal separat, z. B. Altersgruppen nur insgesamt, aber nicht nach Geschlecht, so kann man das sog. RIM weighting anwenden. Man gewichtet nach einander für jedes Merkmal und justiert die Gewichtungsfaktoren in einem iterativen Prozess so lange nach, bis man die Sollverteilung für alle Merkmale hinreichend genau erreicht.

Das Statistikpaket Stata unterscheidet zwischen Häufigkeits-Gewichten (frequency weights; wie oft kommt eine Beobachtung im Datensatz vor), Wahrscheinlichkeits-Gewichten (probability weights; beziehen sich auf die Auswahlwahrscheinlichkeit), analytischen Gewichten (analytic weights; beziehen sich auf die Varianz) und einer etwas nebulösen „Wichtigkeit“ (importance weights).



In SPSS steht das Complex Samples Modul zur Verfügung, mit dem u. a. geschichtete und mehrstufige Stichprobenauswahlen spezifiziert werden können. Deskriptive wie multivariate Prozeduren sind dann separat unter complex samples aufzurufen.

Noch ein Wort aus der Praxis: ich plädiere dafür, Gewichtungsverfahren mit Augenmaß einzusetzen. Kürzlich sah ich eine Studie, in der die Gewichtungsvariable einen Wertebereich von 0,01 bis 6,8 umfasste. D. h. eine Person ging um den Faktor 680 stärker in die Ergebnisse ein als eine andere. Man stelle sich eine Abstimmung vor: einer hat 680 Stimmen, der andere nur eine … In diesem Fall mag die Stichprobe zwar mathematisch exakt an die Grundgesamtheit angepasst sein. Wie zuverlässig die Ergebnisse allerdings die „Realität“ widerspiegeln, ist eine andere Frage. Wenn z. B. Pro- und Contra-Meinungen in Wirklichkeit gleichmäßig verteilt sind und in der Stichprobe ungewichtet ebenfalls, kann es sein, dass es bei aktivierter Gewichtung ganz anders aussieht. Extreme Gewichtungsfaktoren können entstehen, wenn nach zu vielen Merkmalen gewichtet wird.

Vgl. Artikel zum Stichwort Repräsentativität.

Hier eine Buchempfehlung. Das Kapitel zur Gewichtung wurde von Siegfried Gabler und Matthias Ganninger verfasst. Gabler ist einer der renommiertesten Experten in Fragen der Stichprobenziehung und Gewichtung, hat zahlreiche ZUMA-Workshops geleitet. (Das frühere Zentrum für Umfragen, Methoden und Analysen ZUMA heißt inzwischen neudeutsch Survey Design and Methodology SDM.)

Handbuch der sozialwissenschaftlichen Datenanalyse




3 Gedanken zu „Gewichtung mit SPSS Syntaxbeispiel“

Freue mich über Kommentare!