Moderatoreffekte interpretieren und grafisch darstellen

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie abgeleitet, was UV und was Moderator ist) und das Produkt (die Multiplikation) der beiden als sogenannten Interaktionsterm ins Regressionsmodell auf. Erweist sich der Interaktionsterm als signifikant, so liegt ein Moderatoreffekt vor; auf deutsch: die unabhängige Variable wirkt unterschiedlich auf die abhängige Variable ein, je nach Zustand des Moderators.

Neu: Moderatoreffekte im Video

 

Die Herausforderung: genaue Interpretation des Moderatoreffektes

So weit, so gut. Die Schwierigkeiten beginnen oft damit, die Vorzeichen und Wirkungsrichtungen zu interpretieren. Der Effekt der unabhängigen Variablen ist nun nicht mehr allein an ihrem Koeffizienten abzulesen, sondern zusätzlich auch im Interaktionsterm enthalten. Was bedeuten die Ergebnisse nun genau?

Hier helfen grafische Darstellungen. Zunächst ein einfaches, konstruiertes Beispiel (ist nicht von mir, ich bin in einem Statistikforum darauf gestoßen). Nicht zur praktischen Nachahmung empfohlen!

Moderatoreffekt: nur mit Moderator übt die UV einen Effekt auf die AV aus
Moderatoreffekt: Feuerzeug, Benzin, Hautverbrennung; eigene Darstellung

Hier wird die Wirkungsweise eines Moderators hoffentlich noch deutlicher. Schüttet sich jemand Benzin (=unabhängige Variable, UV) auf den Arm, so resultiert daraus noch keine Hautverbrennung (=abhängige Variable, AV). Hält er sich jedoch zusätzlich ein Feuerzeug (Moderator) an den Arm, dann – Kawumm. Je nachdem, ob ein Feuerzeug verwendet wird oder nicht, bewirkt das Benzin einen sehr unterschiedlichen Effekt auf die Haut. (Das Feuerzeug allein wird zu einer gewissen Hautverbrennung führen, aber bei weitem nicht so schlimm wie mit Benzin. Man kann die beiden Effekte nicht getrennt von einander betrachten oder einfach addieren.)

Die Grafik zeigt, dass Benzin ohne Feuerzeug praktisch keinen Einfluss hat, mit Feuerzeug dagegen ein sehr starken.

Beispiel 1: Der Moderator verstärkt eine positive Beziehung

Nun gibt es verschiedene Möglichkeiten, wie Moderatoreffekte wirken können. Ein weiteres Beispiel:

Moderatoreffekt: Lernerfolg, Lernstunden, Entspannungstechnik

Abhängige Variable ist der Lernerfolg; UV: Lernstunden; der Einsatz einer Entspannungstechnik wirkt als Moderator. Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht: die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus. Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik beeinflusst. Mit anderen Worten: Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.

Beispiel 2: Der Moderator schwächt eine positive Beziehung ab

Hier geht es wieder um den Zusammenhang zwischen Lernstunden und Lernerfolg, Moderator ist diesmal jedoch der Alkoholkonsum.

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Diesmal schwächt der Moderator die positive Beziehung ab. Auch hier gilt: der Lernerfolg steigt mit steigender Anzahl der Lernstunden. Mit höherem Alkoholkonsum wird der Zusammenhang jedoch schwächer.

Beispiel 3: Der Moderator verstärkt einen negativen Zusammenhang

Im letzten Beispiel wird ein negativer Effekt nachgewiesen, der durch einen Moderator sogar noch verstärkt wird.



Moderatoreffekt: Ausdauer, Übergewicht, Rauchen

Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.

Übrigens: Findet man keinen Moderatoreffekt, so bedeutet das grafisch, dass die beiden Geraden parallel verlaufen. Alle Beispiele sind konstruiert und beruhen nicht auf realen Daten!

Zuletzt natürlich die Preisfrage: Wie macht man das? Es gibt praktische Excelvorlagen dazu, in die man nur die Modellkoeffizienten eintragen muss. Sogar die Interpretation ist vorbereitet, allerdings auf Englisch.

Fundstelle: StatWiki, Case Western Reserve University, Cleveland, Ohio [URL leider nicht mehr erreichbar]
Excel-Tool, two-way interactions
Weitere Informationen bei Jeremy Dawson.

Bei der Verwendung der Tools von Jeremy Dawson wird zwischen standardisierten und unstandardisierten Variablen unterschieden; StatWiki setzt standardisierte Variablen voraus (als ich das Tool heruntergeladen habe, stand dort der Hinweis „unstandardisiert“ – meines Erachtens ist das falsch!). Manche Autoren empfehlen Standardisierung (vor Berechnung des Interaktionsterms). Dadurch wird der Einfluss unterschiedlicher Skalierungen der Variablen neutralisiert. Ein typisches Beispiel bilden Geschlecht (zwei Ausprägungen) und Alter (z. B. von 18 bis 65). Nachteil der Standardisierung ist schwierigere Interpretierbarkeit: was bedeutet eine Einheit einer standardisierten Variable?

In beiden Fällen sind die unstandardisierten Regressionskoeffizienten (B, nicht beta) einzutragen. Bei unstandardisierten Variablen müssen zusätzlich Mittelwert und Standardabweichung eingetragen werden; bei z-standardisierten Variablen ist dies nicht notwendig, da der Mittelwert 0 beträgt und die Standardabweichung 1.

Viel Erfolg beim Interpretieren von Moderatoreffekten! Welche Erfahrungen haben Sie damit gemacht? Wenn Ihnen der Artikel weitergeholfen hat – bitte weitersagen!

Hier gibt es weitere Anregungen für die Visualisierung statistischer Daten.

Literaturtipp:

Moderator- vs. Mediatoreffekte in kausalanalytischen Untersuchungen




32 Gedanken zu „Moderatoreffekte interpretieren und grafisch darstellen“

  1. Hallo Herr Riepl,
    Vielen Dank für die Erklärung.
    Ich habe bei meiner Bachelorarbeit die Interaktionen einmal mit den standardisierten Werten gemacht und einmal ohne, diese Interaktionen sehen aber teilweise nicht ähnlich aus. Kann das sein oder müsste der Moderatoreffekt (also die beiden Linien) ungefähr gleich aussehen?
    Außerdem kreuzen die Linien sich jetzt über der X-Achse da sie ja standardisiert sind, das sieht zwar nicht schön aus, ist aber nicht zu ändern oder? Die X-Achse sollte schon bei null bleiben denke ich?
    Vielen Dank im Voraus und Viele Grüße
    Viki

    1. Hallo Viki,
      ja, es ist normal, dass Interaktionen mit standardisierten Werten ein wenig anders aussehen. Immerhin werden dabei ja Effekte unterschiedlich großer Skalen ausgeglichen.
      Ich denke es ist nicht störend, wo die Linien sich kreuzen. Wichtig wäre mir vor allem zu zeigen, dass die Linien nicht parallel verlaufen – das ist das wesentliche Kennzeichen des Interaktionseffekts.
      Viele Grüße,
      Wolf

  2. Lieber Herr Riepl,

    vielen Dank für die tolle und anschauliche Erklärung! Ich hätte mal eine Frage zur Moderation innerhalb von Varianzanalysen: Ich möchte eine Moderation rechnen, allerdings ist mein Moderator metrisch. Muss ich diesen Moderator dummy-codieren, um ihn in die Varianzanalyse einfließen zu lassen oder gibt es da auch einen anderen Weg (da die Variable 5 stufig ist, wird die Interpretation des Moderators als Dummy nämlich bestimmt alles andere als einfach).

    Besten Dank und viele Grüße
    Anna

    1. Hallo Anna,
      die Herausforderung liegt nicht im Moderator, sondern in der fünfstufigen Variable. Vorschlag: Regression, vier Dummyvariablen für vier Faktorstufen, die fünfte Stufe kommt nicht ins Modell und dient als Referenzkategorie. Jede der vier Stufen kannst Du mit dem metrischen Moderator multiplizieren, um die Interaktionsterme zu erhalten.
      Mehrere Interaktionsterme in einem Modell sind allerdings sehr schwer zu interpretieren. Ich würde separate Modelle mit jeweils nur einem Moderator verwenden. Interpretation eines signifikanten Moderatorterms: Der Effekt der Stufe x im Vergleich zur Referenzkategorie fällt unterschiedlich aus je nach Ausprägung des Moderators.

      1. Hallo Herr Riepl,
        haben Sie tausend Dank für Ihre schnelle und ausführliche Antwort! Entschuldigung, ich hab mich falsch ausgedrückt! Nicht die Variable ist fünfstufig, sondern der Moderator. Meine unabhängige Variable in der Varianzanalyse ist dichotom (zwei Gruppen) und die unabhängige Variable ist metrisch. Der MODERATOR ist fünfstufig (entschuldigen Sie, da hab ich mich wirklich falsch ausgedrückt)! Ich würde also gerne einen Interaktionseffekt aus meiner unabhängigen Variable (dichotom) und dem Moderator (fünfstufig) berechnen – da wäre also die Frage, ob ich den Moderator einfach dummy-codieren (vier Dummyvariablen, eine Referenzkategorie) kann und dann mit ins Modell einfließen lasse?!
        Vielen Dank und Entschuldigung für die missverständliche Beschreibung
        Anna

        1. Hallo Anna,
          ich denke, in dem Fall ist es ähnlich. Ja, dummy-codieren. Ein Modell mit mehreren Interaktionstermen ist auch so schwer zu interpretieren. Stehen die fünf Stufen für eine bestimmte Reihenfolge? Dann könnte man überlegen, bei einer bestimmten Schwelle (Verteilungen beachten, sodass ausreichende Gruppengrößen entstehen; es muss natürlich auch inhaltlich sinnvoll sein) in hoch und niedrig zu unterscheiden. Wenn allel fünf Stufen wichtig sind, würde ich es mit separaten Modellen versuchen.

          1. Das ist eine super Idee! Die fünf Stufen stehen für „stimme überhaupt nicht zu“ bis „stimme voll und ganz zu“! Eine Unterteilung in zwei Stufen könnte ich auf jeden Fall mal ausprobieren! Haben Sie vielen Dank für die Antwort! Ansonsten sind die separaten Modelle wohl wirklich die beste Lösung!
            Beste Grüße und vielen Dank noch mal
            Anna

          2. Hallo Herr Riepl,

            entschuldigen Sie, ich noch mal 😉 Ich habe eine ganz kurze Nachfrage, da ich gerade versuche, Ihren Vorschlag, meine fünfstufige Variable in eine zweistufige Variable umzuformen, umsetzen möchte.
            Dabei ist mir aufgefallen, dass ich nicht nur die Stufen „stimmt nicht zu“ und „stimmt zu“ umcodieren kann, sondern die Ausprägung „3“ noch bedenken muss, die ja „unentschieden“ bedeutet und sich somit weder zur 1 „stimme nicht zu“ noch zur 2 „stimme zu“ zuordnen lässt. Wenn ich nun meine fünfstufige Variable in eine dreistufige Variable, 1 „stimme nicht zu“, 2 „mittel“ und 3 „stimme zu“ umforme, darf ich dann diese Variable noch als Moderator in das Set der unabhängigen Variable in meine Varianzanalyse nehmen? Oder kann ich dann eine Dummy-Codierung dieses dreistufigen Moderators nicht umgehen?

            Haben Sie besten Dank für Ihre Hilfe
            Anna

          3. Ich würde mir die Verteilungen ansehen und dann zwei Gruppen bilden. Z. B. „Stimme zu“ vs. „Unentschieden / stimme nicht zu“.

  3. Hallo Herr Riepl,
    Ich habe eine Frage zur z-Standardisierung eines dichotomen Moderators. Ich habe bereits einiges zur z-Standardisierung gelesen und bin mir jetzt nicht sicher, ob das in meinem Fall sinnvoll wäre oder nicht.
    Konrekt: mein Prädiktor ist Gewissenhaftigkeit (kontinuierlich), mein potentieller Moderator ist Arbeitslosigkeit (dichotom) und das Kriterium ist Lebenszufriedenheit (kontinuierlich). In meiner Statistik Vorlesung habe ich gelernt, dass man Prädiktor und Moderator am besten z-standardisiert. Wie ich in einem Buch (Hayes : Introduction to Mediation, Moderation and Conditional Process Analysis) gelesen habe, ändert eine z-Standardisierung nichts am Ergebnis für den Interaktionsterm, sondern es geht dabei vielmehr um die Interpretierbarkeit der Moderation. Jetzt habe ich Bedenken, dass eine z-Standardisierung von Arbeitslosigkeit dazu führt, dass ich das ganze weniger gut interpretieren kann, daher würde ich eher nicht standardisieren.
    Wie ist Ihre Meinung denn dazu?
    Liebe Grüße,
    Christine

    1. Hallo Christine,
      bei dichotomen Merkmalen halte ich eine z-Standardisierung nicht für sinnvoll.
      Viele Grüße & viel Erfolg!
      Wolf Riepl

  4. Hallo, ich hoffe hier ist noch wer aktiv…
    ich untersuche zZ den Zusammenhang von versch. Lerngelegenheiten(UV) mit dem daraus folgenden Wissenscore (AV, intervallskaliert). Dabei werden Kontrollmerkmale eingebracht (Berufswunsch ja/nein; absolvierte Ausbildung ja/nein; Intelligenz intervallskaliert). Ein positiver Einfluss von Anzahl der Lerngelegenheiten auf Wissen wird erwartet. Nun könnte ich doch einfach eine Regression berechnen und die 3 Merkmale zur Kontrolle mit einbringen.
    Hintergrund: Ich benötige min. 3 Hypothesen (max 5). Da ich nur 2 versch Lerngelegenheiten a und b habe kann ich ja nur 2 Hypothesen aufstellen.
    Var1 (nicht ausreichend)
    H1 Anzahl LGa wirkt positiv auf Wissen
    H2 Anzahl LG2 wirkt positiv auf Wissen
    jeweils unter Hinzunahme der 3 Kontrollvariablen.

    Nun bekam ich den Tip das mit Mediatoreffekten zu machen, weil ich so mehr Hypothesen aufstellen könne(?).
    Aktuelle Studien konnten zeigen dass Intelligenz in diesem Fall nicht so sehr wirkt, so könnt ich das begründet weg lassen.
    Außerdem hat die Ausbildung wohl den größten Effekt weshalb ich bei LGb auch nur diese mit einbeziehen würde.

    Var2 (machbar?)
    H1.1 Anzahl LGa wirkt positiv auf Wissen (normale Regression)
    H1.2 Anzahl LGa*Berufswunsch wirkt positiv auf Wissen (Moderatoreffekt)
    H1.3 Anzahl LGa*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    H2.1 Anzahl LGb wirkt positiv auf Wissen (normale Regression)
    H2.2 Anzahl LGb*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    Das ganze auf 30 Seiten Bachelorarbeit.
    Wie seht ihr das?

    1. Hallo Dirk,

      meinst Du Moderator- oder Mediator-Effekt? Das sind unterschiedliche Modelle und unterschiedliche Hypothesen. Oben steht Mediator, unten Moderator. Die Hypothesen passen zu Moderator-Effekten.
      Ja, hört sich gut an.

      Formulierungsvorschlag:
      Anzahl LG (gilt für a und/oder b) wirkt unterschiedlich auf Wissen je nach Ausbildung bzw. Berufswunsch.

      Viel Erfolg!

      Wolf

  5. Lieber Wolf,

    besten Dank für die einfache und gut erklärte Darstellung der Moderationseffekte! Ich hatte in der Tat anfangs gar keinen Plan gehabt, wie ich die Interaktionen richtig interpretieren soll! Toll gemacht!

    LG aus NRW,

    Tati

  6. Hallo Wolf,

    danke für dein aufschlussreiches Video. Ich hätte eine Frage zu einem Untersuchungsdesign, das etwas komplizierter ist.

    Ich habe zwei intervallskalierte UV (zB: Intelligenz und Arroganz) und eine Gruppenvariable mit Gruppen (zB. Unter-, Mittel- und Oberschicht). Meine AV wäre intervallskaliert (zB. Anzahl Fotos Instagram).

    Erhalte ich nun einen, zwei oder drei Interaktionsterme und wie interpretiere ich das Ergebnis?

    Vielen Danke für deine Hilfe.

    Patrick

    1. Hallo Patrick,
      das ist in der Tat kompliziert. Hast Du denn Hypothesen zu allen Interaktionen? Ich würde mir die Interaktionen einzeln anschauen, d. h. ein Interaktionsterm pro Modell (sowie die Haupteffekte, d. h. die UVs, die die Interaktion bilden, auch einzeln in das Modell aufnehmen). Wenn Du die Gruppenvariable nicht sehr grob als (quasi-)metrisch auffassen willst, musst Du mit Dummyvariablen arbeiten, d. h. 0/1-Codierung. Ich würde dann eine Gruppe mit allen anderen vergleichen. Z. B. Gruppenvariable Unterschicht, 1=Unterschicht, 0=keine Unterschicht. Gibt es eine Interaktion, dann unterscheidet sich die Steigung der Regressionsgeraden zwischen Unterschicht und „Nicht-Unterschicht“.
      Ich weiß nicht, ob sich ein Gesamtmodell mit mehreren Interaktionstermen sinnvoll interpretieren lässt. Für jeden Term müsste gelten „wenn alle anderen Modellvariablen konstant gehalten werden“.
      Also generell: So einfach wie möglich, so komplex wie nötig. Ich bezweifle, dass es „nötig“ ist, alle Interaktionen in ein Modell zu werfen und dann exakt zu interpretieren …
      Viel Erfolg!

      1. Vielen Dank für die schnelle Antwort. Ich möchte ein großes Modell haben und habe insgesamt 4 Prädiktoren und zwei Interaktionsterme, die unter Berücksichtigung der Literatur sinnvoll wären. Die Prädiktoren und Interaktionsterme würde ich dann gerne hierarchisch aufnehmen.
        Ich glaube, dass ich mir noch mal den Bühner/Ziegler vornehme und mit meinem Prof. berate.
        Danke für die Erklärung.

  7. Hallo,

    ich habe ähnlich wie Deleno einen metrischen Moderator, während der andere UV kategorial ist. AV ist metrisch. Ich habe vor der Analyse metrischen Variablen standardisiert, die kategoriale Variable (3 Stufen) dummycodiert. Ich habe auch die Grafik erstellt, die jedoch gleich ist mit deiner – bei dir fungiert jedoch der kategoriale Prädiktor als Moderator. Ist es falsch, wenn ich gleiche Grafik verwende und sage, dass die metrische Variable der Moderator ist, wobei der auf der x-Achse abgebildet ist?

    Tausend Dank im Voraus!

    Lena

    1. Hallo Lena,
      klingt erst mal vernünftig. Kannst Du das Ergebnis interpretieren, sodass es inhaltlich sinnvoll ist und zur Grafik passt? Dann denke ich passt es.

  8. Hallo,

    vielen Dank für die gute Erklärung!!! Kann es eigentlich Probleme geben, wenn ich einen dichotomen Moderator (0 und 1) habe, wo die Stichprobengröße verschieden ist? Also wenn N = 600 für Ausprägung 0 und N = 2000 für Ausprägung 1 betragen. Oder wird das durch Gewichtung und Z-Standardisierung (der UV, nicht der Dummyvariable) ausgeglichen?

    Lieben Gruß
    Joleena

    1. Hallo Joleena,
      ich verstehe es so: Die Stichprobengröße ist N=(2000+600)=2.600.
      Bei einem dichotomen Merkmal wird man nur in seltenen Fällen eine genaue Gleichverteilung der beiden Ausprägungen erreichen. Prinzipiell und in Deinem Beispiel halte ich das für völlig unproblematisch. Schwierig wird es nur, wenn eine Ausprägung sehr schwach besetzt ist. Z. B. 10 mal die 0 und 2590 mal die 1. Dann wären die Ergebnisse nicht besonders belastbar. Aber bei 600 / 2000 sehe ich da kein Problem.

      Ungleiche Gruppengrößen kann man natürlich durch Gewichtung ausgleichen. Das könnte sinnvoll sein, wenn „in Wirklichkeit“ (in der Grundgesamtheit) die Verteilung des dichotomen Merkmals ausgeglichen ist (50/50). Das muss nicht so sein.

      z-Standardisierung passt hier meines Erachtens nicht. Die ist sinnvoll, wenn man verschiedene Merkmale hat, die auf unterschiedlichen Skalen gemessen wurden, z. B. Alter in Jahren, Länge in Zentimetern usw. Dann hat „eine Einheit“ je nach Merkmal eine ganz unterschiedliche Bedeutung. Ohne Standardisierung können Merkmale mit „großen“ Skalen einen größeren Einfluss auf die Ergebnisse ausüben als Merkmale mit „kleinen“ Skalen.

  9. Hallo,

    kurz eine Frage zum Interaktionseffekt:
    Im Interaktionsterm in der Regression wird nur die Gruppe analysiert, die als UV mit dem Wert 1 kodiert ist oder?
    Also wenn z.B.
    UV=Migration –> 0=kein Migrationshintergrund und 1=Migrationshintergrund
    Moderator= Einkommen (metrisch: hohe Werte= hohes Einkommen)

    Dann wäre die Interpretation des Interaktionseffektes: je reicher ein Migrant desto…

    Kann man irgendwie auch untersuchen, wie sich hohes Einkommen bei Personen ohne Migrationshintergrund auswirken würde?

    Vielen Dank

    1. Hallo Deleno,
      es geht um eine Wechselwirkung. Also nicht: Je reicher, desto, … Sondern: Bei höherem Einkommen wirkt der Migrationshintergrund anders auf die AV als bei niedrigem Einkommen.

      Vielleicht fällt die Interpretation leichter, wenn Du den Migrationshintergrund als Moderator betrachtest? Formulierungsvorschlag: Mit Migrationshintergrund wirkt das Einkommen anders auf die AV als ohne Migrationshintergrund.

      1. Hmm..aber könnte der Interaktionseffekt dann nicht so interpretiert werden:
        Je höher das Einkomen, desto zufriedener sind Migranten? (wenn Einkommen einen positiven Effekt hat)

        1. Versuch es mal einfach:
          Wie ist die Korrelation zwischen Einkommen und Zufriedenheit (das ist wohl die AV) insgesamt?
          Und dann getrennt für Migranten und Nicht-Migranten: Wie ist da jeweils einzeln die Korrelation zwischen Einkommen und Zufriedenheit? Unterscheiden sich die Korrelationskoeffizienten?

  10. Hallo,

    danke erstmal für die gute Erklärung!
    Ich habe eine Frage zu dem Video. Wie würde nun die Regressionsgleichung für das Modell mit dem Interaktionseffekt (03:50 Minuten) aussehen, wenn ich den Lernerfolg voraussagen möchte?
    Bleibt der Term Lernstunden in dem Regressionsmodell, obwohl es nicht signifikant (0.199) ist oder wird der Term entfernt und das Modell erneut berechnet?

    Vielen Dank

    1. Hallo Philipp,
      ich würde die Lernstunden drinlassen. Das Besondere an den Interaktionseffekten ist ja, dass der Effekt der Lernstunden nicht mehr nur in dem Prädiktor Lernstunden steckt, sondern auch zum Teil in dem Interaktionsterm Lernstunden * Entspannungstechnik, der signifikant ist. D. h. diese beiden Terme sind nicht von einander unabhängig; beide „gehören“ zum Modell.
      Viel Erfolg mit Deinen Analysen!
      Wolf

Freue mich über Kommentare!