Signifikanztests bei Mehrfachantworten in SPSS

SPSS Logo

Kann man bei Mehrfachantworten Signifikanztests ausführen? Mehrfachantworten setzen sich typischerweise aus mehreren Variablen zusammen. Z. B. könnte in drei Variablen erfasst werden, welche Zeitungsarten jemand liest: Tageszeitung, Wochenzeitung, Fachzeitschrift. Nun wollen wir wissen, ob es bei den Lesegewohnheiten Geschlechtsunterschiede gibt bzw. anders formuliert, ob Lesegewohnheiten und Geschlecht von einander unabhängig sind.

 

Chi-Quadrat-Test für Kreuztabellen

Dazu bietet sich der Chi-Quadrat-Test an. Wir könnten für jede Zeitungsart einzeln testen, ob es Geschlechtsunterschiede gibt. Schöner wäre es jedoch, dafür ein Mehrfachantworten-Set zu nutzen, also eine gemeinsame Kreuztabelle mit den Zeitungsarten und dem Geschlecht zu erstellen. In SPSS können wir unter Analysieren – Mehrfachantworten – Kreuztabellen zwar eine solche Tabelle erstellen, jedoch steht hier kein Signifikanztest zur Verfügung.

Chi-Quadrat-Test bei Mehrfachantworten: Benutzerdefinierte Tabellen

Bei den benutzerdefinierten Tabellen (custom tables, ctables) ist dies möglich. Dieses Modul ist nicht im Basisumfang von SPSS enthalten. Wer darüber verfügt, kann unter Analysieren – Tabellen zunächst das Mehrfachantworten-Set definieren, also die Variablen angeben, die gemeinsam als Mehrfachantworten auszuwerten sind. Dann wird eine Kreuztabelle zusammengestellt, und hier steht nun auch der Chi-Quadrat-Test zur Verfügung. Hier ein Syntaxbeispiel:

SPSS-Syntaxbeispiel für Mehrfachantworten mit benutzerdefinierten Tabellen

Oben wird das Set definiert, hier als Dichotomien, d. h. mit 0/1-codierten Variablen.

Unten wird die Kreuztabelle angefordert, wobei das Mehrfachantworten-Set mit dem Dollarzeichen gekennzeichnet ist: „$Zeitungen“. Die Zeile „/sigtest type=chisquare“ fordert den Chi-Quadrat-Test an.

Das Ergebnis kann z. B. so aussehen:



Chi-Quadrat-Test bei Mehrfachantworten: Ergebnisbeispiel

 

40% der Frauen lesen Tageszeitung, aber 100% der Männer. Alle Frauen (100%) lesen Wochenzeitungen, aber nur 20% der Männer. Die Geschlechtsunterschiede sind deutlich und laut Chi-Quadrat-Test auch signifikant (p=0,006). Allerdings sind in diesem konstruierten Beispiel die Fallzahlen sehr gering. Zu viele Zellen sind zu schwach besetzt, sodass die Ergebnisse sehr vorsichtig zu interpretieren sind.

Hier ein Beitrag zur Interpretation von Mehrfachantworten; vgl. auch den Blogartikel dazu.

 

In folgendem Videobeitrag zeige ich, wie benutzerdefinierte Kreuztabellen in SPSS gestaltet werden können:


13 Gedanken zu „Signifikanztests bei Mehrfachantworten in SPSS“

  1. Hallo Wolf,

    ich stoße auf der Suche nach Analysemöglichkeiten von Mehrfachantworten immer wieder auf das Beispiel der Untersuchung zwischen Mann und Frau.
    In meinem Fall interessiert mich aber eigentlich der Unterschied zwischen den verschiedenen Antwortmöglichkeiten.
    Um es auf dein Beispiel anzupassen: Die Leute haben die Wahl zwischen Tageszeitung, Wochenzeitung und Weder noch. Ich möchte nun schauen, ob es Unterschiede zwischen den einzelnen möglichen Antworten gibt und daraus ableiten, welche Zeitung man am besten produzieren sollte (weil sie mehr Abnehmer findet).

    Liebe Grüße
    Marius

    1. Hallo Marius,
      wenn ich Dich recht verstehe, geht es Dir gar nicht um eine Kreuztabelle, sondern nur um das Merkmal mit den Mehrfachantworten. Und Du willst wissen, ob eine Option signifikant häufiger genannt wurde als andere. Da gibt es verschiedene Möglichkeiten und es kommt auf die Hypothese an, die Du testen möchtest. Z. B. wurde Option A signifikant häufiger genannt als alle anderen? Oder häufiger als eine bestimmte andere Option? Für den Test würde ich nicht mit dem Mehrfachantworten-Set arbeiten (das für eine deskriptive Tabelle sinnvoll ist), sondern mit den einzelnen Variablen für jede Option. Schau Dir mal den McNemar-Test an. Voraussetzung ist, dass Du die Antworten zu Option A in einer Variable hast. (Gegenbeispiel: Variablen wie Antwort1, Antwort2, Antwort3, und in jeder könnte Option A genannt werden. Dann müsstest Du umcodieren.)

      1. Hey Wolf,

        danke für die schnelle Antwort. Genau, es geht mir darum zu wissen, ob eine Option signifikant häufiger geannt wurde als eine andere. Ehrlich gesagt, arbeite ich auch nicht mit SPSS und daher auch nicht mit den Sets, ich fand trotzdem, dass mir die Erklärung weiter näher gebracht hat, dass meine Frage nicht durch einen Chi²-Test beantwortet werden kann.

        Mein Datensatz ist so aufgebaut, dass ich für jede Antwortmöglichkeit eine Variable habe, die durch 0 und 1 (nein, ja) dummy-kodiert ist.

        Von dem Test hatte ich bisher noch gar nichts gehört. Aber das, was ich jetzt so gelesen habe, lässt mich darauf schließen, dass das ja eigentlich ein chi²-test für Messwiederholungen ist, oder sehe ich das falsch? In dem Fall würde das denke ich auch nicht so ganz auf mein Problem passen, da es ja kein AB Test sein soll.

        1. Dummycodierung ist gut. Ja, Messwiederholung klingt erst mal ungewöhnlich, aber ich denke das trifft es. Du hast ja keinen Gruppenvergleich. Wenn ich es richtig verstehe, konnte jeder Befragte sich zu jeder Option äußern. Also sozusagen abhängige Stichproben.

          1. Ja, da hast du recht. Ich werde es mal so behandeln und den McNemar Test nutzen. Vielen Dank für den Input!

  2. Lieber Wolf,

    ich hab noch mal eine Frage. Kann es sein, dass beim Chi-Quadrat-Test mit den benutzerdefinierten Tabellen die falsche Anzahl an Freiheitsgraden anzeigt wird? Die berechnen sich doch durch (Anzahl der Zeilen -1 ) x (Anzahl der Spalten -1). Das wäre ja dann in deinem Beispiel oben (Geschlecht/Wochenzeitung) ein df = 2. In der Tabelle wird aber df = 3 angezeigt. In meinen Tabellen kommt auch immer ein höheres df raus als mit der Formel. Weißt du woran das liegt? Wäre sehr dankbar über eine Antwort!

    Viele Grüße,
    Leonie

    1. Liebe Leonie,
      gut aufgepasst – spannender Hinweis! Ich denke es hängt mit der Besonderheit der Mehrfachantworten zusammen. Hier würde ich die Freiheitsgrade berechnen als (Anzahl Geschlechter minus 1) mal (Anzahl Mehrfachantwort-Optionen), also (2-1) * 3 = 1 * 3 = 3.

      Die Idee der Freiheitsgrade verstehe ich so:
      Wenn sich ein Leser für eine von den drei Zeitungen aus dem Beispiel oben entscheiden muss (Einfachantwort, single choice) und ich weiß, dass er sich nicht für die Tageszeitung und nicht für die Wochenzeitung entschieden hat, dann ist klar, dass es das Fachmagazin sein muss. Das heißt kenne ich die Antwort auf die ersten beiden Optionen, dann steht schon fest, ob die dritte Option gewählt wurde oder nicht. So verliere ich einen Freiheitsgrad – der dritte Wert kann nicht frei variieren.

      Bei Mehrfachantworten ist das anders: Jede Option kann gewählt werden, unabhängig davon, ob andere Optionen gewählt wurden oder nicht. Wenn ich weiß, ob jemand sich für Tages- und Wochenzeitung entschieden hat, weiß ich noch nicht, ob er auch (ggf. zusätzlich) das Fachmagazin liest. Ich verliere keinen Freiheitsgrad, jeder Wert kann frei variieren.

      Nlachvollziehbar?

      Viele Grüße!

      1. Das klingt sehr einleuchtend! Mit dieser Formel komme ich nun auch immer auf den angezeigten Wert. Tausend Dank, das war eine sehr große Hilfe! Liebe Grüße

  3. Danke!

    Das mag eine dumme Frage sein, aber welchen N-Wert gebe ich dann beim korrekten Berichten des Chi²-Wertes an?
    Ich habe z. B. 257 Personen, die auf meine MC-Frage geantwortet haben. Zählt man alle Antworten einzeln, komme ich auf 715 Reaktionen.
    Ist es dann χ²(7, N = 257) = 37.03, p < .001 oder χ²(7, N = 715) = 37.03, p < .001?

    1. Hallo Air,
      sehr gute, berechtigte Frage! In einem Statistik-Forum hab ich die Erklärung gefunden, dass Signifikanztests bei Mehrfachantworten gar nicht möglich bzw. nicht sinnvoll sind … Ich würde es ausführlich machen und beide Fallzahlen berichten: N (Personen)=257, N (Antworten)=715.

      1. Hallo Wolf,

        ich habe bereits einige Chi-Tests mit Mehrfachangaben und benutzerdefinierten Tabellen durchgeführt und benötige nun noch jeweils das Cramérs V als Effektstärke. Das muss ich ja dann von Hand ausrechnen. Weißt du welches N ich dafür nehme? Die Anzahl der Fälle oder der Nennungen?

        Und gibt es denn eine zitierbare Quelle dafür, dass Signifikanztests bei Mehrfachangaben eigentlich gar nicht möglich bzw. nicht sinnvoll sind?

        Viele Grüße,
        Leonie

        1. Hallo Leonie,
          sorry, hab grad keine Quelle zur Hand und komme leider nicht dazu, das zu recherchieren. Ich würde die kleinere Fallzahl berichten (also Fälle, nicht Nennungen), denn sonst könnte man ja bei einer kleinen Stichprobe höhere Ns erreichen, indem man ganz viele Mehrfach-Optionen anbietet … Das käme mir nicht sauber vor.

          1. Ok, danke dir! Ich war mir eben nicht sicher, ob die Berechnung des V mit der Anzahl der Fälle nicht verfälscht wird. Da ja der Chi-Wert ja auch auf der Anzahl der Nennungen basiert.

Freue mich über Kommentare!