Moderatoreffekte interpretieren und grafisch darstellen

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie abgeleitet, was UV und was Moderator ist) und das Produkt (die Multiplikation) der beiden als sogenannten Interaktionsterm ins Regressionsmodell auf. Erweist sich der Interaktionsterm als signifikant, so liegt ein Moderatoreffekt vor; auf deutsch: die unabhängige Variable wirkt unterschiedlich auf die abhängige Variable ein, je nach Zustand des Moderators.

Neu: Moderatoreffekte im Video

 

Die Herausforderung: genaue Interpretation des Moderatoreffektes

So weit, so gut. Die Schwierigkeiten beginnen oft damit, die Vorzeichen und Wirkungsrichtungen zu interpretieren. Der Effekt der unabhängigen Variablen ist nun nicht mehr allein an ihrem Koeffizienten abzulesen, sondern zusätzlich auch im Interaktionsterm enthalten. Was bedeuten die Ergebnisse nun genau?

Hier helfen grafische Darstellungen. Zunächst ein einfaches, konstruiertes Beispiel (ist nicht von mir, ich bin in einem Statistikforum darauf gestoßen). Nicht zur praktischen Nachahmung empfohlen!

Moderatoreffekt: nur mit Moderator übt die UV einen Effekt auf die AV aus
Moderatoreffekt: Feuerzeug, Benzin, Hautverbrennung; eigene Darstellung

Hier wird die Wirkungsweise eines Moderators hoffentlich noch deutlicher. Schüttet sich jemand Benzin (=unabhängige Variable, UV) auf den Arm, so resultiert daraus noch keine Hautverbrennung (=abhängige Variable, AV). Hält er sich jedoch zusätzlich ein Feuerzeug (Moderator) an den Arm, dann – Kawumm. Je nachdem, ob ein Feuerzeug verwendet wird oder nicht, bewirkt das Benzin einen sehr unterschiedlichen Effekt auf die Haut. (Das Feuerzeug allein wird zu einer gewissen Hautverbrennung führen, aber bei weitem nicht so schlimm wie mit Benzin. Man kann die beiden Effekte nicht getrennt von einander betrachten oder einfach addieren.)

Die Grafik zeigt, dass Benzin ohne Feuerzeug praktisch keinen Einfluss hat, mit Feuerzeug dagegen ein sehr starken.

Beispiel 1: Der Moderator verstärkt eine positive Beziehung

Nun gibt es verschiedene Möglichkeiten, wie Moderatoreffekte wirken können. Ein weiteres Beispiel:

Moderatoreffekt: Lernerfolg, Lernstunden, Entspannungstechnik

Abhängige Variable ist der Lernerfolg; UV: Lernstunden; der Einsatz einer Entspannungstechnik wirkt als Moderator. Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht: die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus. Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik beeinflusst. Mit anderen Worten: Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.

Beispiel 2: Der Moderator schwächt eine positive Beziehung ab

Hier geht es wieder um den Zusammenhang zwischen Lernstunden und Lernerfolg, Moderator ist diesmal jedoch der Alkoholkonsum.

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Diesmal schwächt der Moderator die positive Beziehung ab. Auch hier gilt: der Lernerfolg steigt mit steigender Anzahl der Lernstunden. Mit höherem Alkoholkonsum wird der Zusammenhang jedoch schwächer.

Beispiel 3: Der Moderator verstärkt einen negativen Zusammenhang



Im letzten Beispiel wird ein negativer Effekt nachgewiesen, der durch einen Moderator sogar noch verstärkt wird.

Moderatoreffekt: Ausdauer, Übergewicht, Rauchen

Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.

Übrigens: Findet man keinen Moderatoreffekt, so bedeutet das grafisch, dass die beiden Geraden parallel verlaufen. Alle Beispiele sind konstruiert und beruhen nicht auf realen Daten!

Zuletzt natürlich die Preisfrage: Wie macht man das? Es gibt praktische Excelvorlagen dazu, in die man nur die Modellkoeffizienten eintragen muss. Sogar die Interpretation ist vorbereitet, allerdings auf Englisch.

Fundstelle: StatWiki, Case Western Reserve University, Cleveland, Ohio [URL leider nicht mehr erreichbar]
Excel-Tool, two-way interactions
Weitere Informationen bei Jeremy Dawson.

Bei der Verwendung der Tools von Jeremy Dawson wird zwischen standardisierten und unstandardisierten Variablen unterschieden; StatWiki setzt standardisierte Variablen voraus (als ich das Tool heruntergeladen habe, stand dort der Hinweis „unstandardisiert“ – meines Erachtens ist das falsch!). Manche Autoren empfehlen Standardisierung (vor Berechnung des Interaktionsterms). Dadurch wird der Einfluss unterschiedlicher Skalierungen der Variablen neutralisiert. Ein typisches Beispiel bilden Geschlecht (zwei Ausprägungen) und Alter (z. B. von 18 bis 65). Nachteil der Standardisierung ist schwierigere Interpretierbarkeit: was bedeutet eine Einheit einer standardisierten Variable?

In beiden Fällen sind die unstandardisierten Regressionskoeffizienten (B, nicht beta) einzutragen. Bei unstandardisierten Variablen müssen zusätzlich Mittelwert und Standardabweichung eingetragen werden; bei z-standardisierten Variablen ist dies nicht notwendig, da der Mittelwert 0 beträgt und die Standardabweichung 1.

Viel Erfolg beim Interpretieren von Moderatoreffekten! Welche Erfahrungen haben Sie damit gemacht? Wenn Ihnen der Artikel weitergeholfen hat – bitte weitersagen!

Hier gibt es weitere Anregungen für die Visualisierung statistischer Daten.

Literaturtipp:

Moderator- vs. Mediatoreffekte in kausalanalytischen Untersuchungen

Wissenschaft bei Nacht: Nachts sind alle Theorien grau.

18 Gedanken zu „Moderatoreffekte interpretieren und grafisch darstellen“

  1. Lieber Wolf,

    besten Dank für die einfache und gut erklärte Darstellung der Moderationseffekte! Ich hatte in der Tat anfangs gar keinen Plan gehabt, wie ich die Interaktionen richtig interpretieren soll! Toll gemacht!

    LG aus NRW,

    Tati

  2. Hallo Wolf,

    danke für dein aufschlussreiches Video. Ich hätte eine Frage zu einem Untersuchungsdesign, das etwas komplizierter ist.

    Ich habe zwei intervallskalierte UV (zB: Intelligenz und Arroganz) und eine Gruppenvariable mit Gruppen (zB. Unter-, Mittel- und Oberschicht). Meine AV wäre intervallskaliert (zB. Anzahl Fotos Instagram).

    Erhalte ich nun einen, zwei oder drei Interaktionsterme und wie interpretiere ich das Ergebnis?

    Vielen Danke für deine Hilfe.

    Patrick

    1. Hallo Patrick,
      das ist in der Tat kompliziert. Hast Du denn Hypothesen zu allen Interaktionen? Ich würde mir die Interaktionen einzeln anschauen, d. h. ein Interaktionsterm pro Modell (sowie die Haupteffekte, d. h. die UVs, die die Interaktion bilden, auch einzeln in das Modell aufnehmen). Wenn Du die Gruppenvariable nicht sehr grob als (quasi-)metrisch auffassen willst, musst Du mit Dummyvariablen arbeiten, d. h. 0/1-Codierung. Ich würde dann eine Gruppe mit allen anderen vergleichen. Z. B. Gruppenvariable Unterschicht, 1=Unterschicht, 0=keine Unterschicht. Gibt es eine Interaktion, dann unterscheidet sich die Steigung der Regressionsgeraden zwischen Unterschicht und „Nicht-Unterschicht“.
      Ich weiß nicht, ob sich ein Gesamtmodell mit mehreren Interaktionstermen sinnvoll interpretieren lässt. Für jeden Term müsste gelten „wenn alle anderen Modellvariablen konstant gehalten werden“.
      Also generell: So einfach wie möglich, so komplex wie nötig. Ich bezweifle, dass es „nötig“ ist, alle Interaktionen in ein Modell zu werfen und dann exakt zu interpretieren …
      Viel Erfolg!

      1. Vielen Dank für die schnelle Antwort. Ich möchte ein großes Modell haben und habe insgesamt 4 Prädiktoren und zwei Interaktionsterme, die unter Berücksichtigung der Literatur sinnvoll wären. Die Prädiktoren und Interaktionsterme würde ich dann gerne hierarchisch aufnehmen.
        Ich glaube, dass ich mir noch mal den Bühner/Ziegler vornehme und mit meinem Prof. berate.
        Danke für die Erklärung.

  3. Hallo,

    ich habe ähnlich wie Deleno einen metrischen Moderator, während der andere UV kategorial ist. AV ist metrisch. Ich habe vor der Analyse metrischen Variablen standardisiert, die kategoriale Variable (3 Stufen) dummycodiert. Ich habe auch die Grafik erstellt, die jedoch gleich ist mit deiner – bei dir fungiert jedoch der kategoriale Prädiktor als Moderator. Ist es falsch, wenn ich gleiche Grafik verwende und sage, dass die metrische Variable der Moderator ist, wobei der auf der x-Achse abgebildet ist?

    Tausend Dank im Voraus!

    Lena

    1. Hallo Lena,
      klingt erst mal vernünftig. Kannst Du das Ergebnis interpretieren, sodass es inhaltlich sinnvoll ist und zur Grafik passt? Dann denke ich passt es.

  4. Hallo,

    vielen Dank für die gute Erklärung!!! Kann es eigentlich Probleme geben, wenn ich einen dichotomen Moderator (0 und 1) habe, wo die Stichprobengröße verschieden ist? Also wenn N = 600 für Ausprägung 0 und N = 2000 für Ausprägung 1 betragen. Oder wird das durch Gewichtung und Z-Standardisierung (der UV, nicht der Dummyvariable) ausgeglichen?

    Lieben Gruß
    Joleena

    1. Hallo Joleena,
      ich verstehe es so: Die Stichprobengröße ist N=(2000+600)=2.600.
      Bei einem dichotomen Merkmal wird man nur in seltenen Fällen eine genaue Gleichverteilung der beiden Ausprägungen erreichen. Prinzipiell und in Deinem Beispiel halte ich das für völlig unproblematisch. Schwierig wird es nur, wenn eine Ausprägung sehr schwach besetzt ist. Z. B. 10 mal die 0 und 2590 mal die 1. Dann wären die Ergebnisse nicht besonders belastbar. Aber bei 600 / 2000 sehe ich da kein Problem.

      Ungleiche Gruppengrößen kann man natürlich durch Gewichtung ausgleichen. Das könnte sinnvoll sein, wenn „in Wirklichkeit“ (in der Grundgesamtheit) die Verteilung des dichotomen Merkmals ausgeglichen ist (50/50). Das muss nicht so sein.

      z-Standardisierung passt hier meines Erachtens nicht. Die ist sinnvoll, wenn man verschiedene Merkmale hat, die auf unterschiedlichen Skalen gemessen wurden, z. B. Alter in Jahren, Länge in Zentimetern usw. Dann hat „eine Einheit“ je nach Merkmal eine ganz unterschiedliche Bedeutung. Ohne Standardisierung können Merkmale mit „großen“ Skalen einen größeren Einfluss auf die Ergebnisse ausüben als Merkmale mit „kleinen“ Skalen.

  5. Hallo,

    kurz eine Frage zum Interaktionseffekt:
    Im Interaktionsterm in der Regression wird nur die Gruppe analysiert, die als UV mit dem Wert 1 kodiert ist oder?
    Also wenn z.B.
    UV=Migration –> 0=kein Migrationshintergrund und 1=Migrationshintergrund
    Moderator= Einkommen (metrisch: hohe Werte= hohes Einkommen)

    Dann wäre die Interpretation des Interaktionseffektes: je reicher ein Migrant desto…

    Kann man irgendwie auch untersuchen, wie sich hohes Einkommen bei Personen ohne Migrationshintergrund auswirken würde?

    Vielen Dank

    1. Hallo Deleno,
      es geht um eine Wechselwirkung. Also nicht: Je reicher, desto, … Sondern: Bei höherem Einkommen wirkt der Migrationshintergrund anders auf die AV als bei niedrigem Einkommen.

      Vielleicht fällt die Interpretation leichter, wenn Du den Migrationshintergrund als Moderator betrachtest? Formulierungsvorschlag: Mit Migrationshintergrund wirkt das Einkommen anders auf die AV als ohne Migrationshintergrund.

      1. Hmm..aber könnte der Interaktionseffekt dann nicht so interpretiert werden:
        Je höher das Einkomen, desto zufriedener sind Migranten? (wenn Einkommen einen positiven Effekt hat)

        1. Versuch es mal einfach:
          Wie ist die Korrelation zwischen Einkommen und Zufriedenheit (das ist wohl die AV) insgesamt?
          Und dann getrennt für Migranten und Nicht-Migranten: Wie ist da jeweils einzeln die Korrelation zwischen Einkommen und Zufriedenheit? Unterscheiden sich die Korrelationskoeffizienten?

  6. Hallo,

    danke erstmal für die gute Erklärung!
    Ich habe eine Frage zu dem Video. Wie würde nun die Regressionsgleichung für das Modell mit dem Interaktionseffekt (03:50 Minuten) aussehen, wenn ich den Lernerfolg voraussagen möchte?
    Bleibt der Term Lernstunden in dem Regressionsmodell, obwohl es nicht signifikant (0.199) ist oder wird der Term entfernt und das Modell erneut berechnet?

    Vielen Dank

    1. Hallo Philipp,
      ich würde die Lernstunden drinlassen. Das Besondere an den Interaktionseffekten ist ja, dass der Effekt der Lernstunden nicht mehr nur in dem Prädiktor Lernstunden steckt, sondern auch zum Teil in dem Interaktionsterm Lernstunden * Entspannungstechnik, der signifikant ist. D. h. diese beiden Terme sind nicht von einander unabhängig; beide „gehören“ zum Modell.
      Viel Erfolg mit Deinen Analysen!
      Wolf

Freue mich über Kommentare!