Moderatoreffekte interpretieren und grafisch darstellen

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie abgeleitet, was UV und was Moderator ist) und das Produkt (die Multiplikation) der beiden als sogenannten Interaktionsterm ins Regressionsmodell auf. Erweist sich der Interaktionsterm als signifikant, so liegt ein Moderatoreffekt vor; auf deutsch: die unabhängige Variable wirkt unterschiedlich auf die abhängige Variable ein, je nach Zustand des Moderators.

Update: Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video:
Regressionsmodelle visualisieren in R (ggplot2, plotly)

Moderatoreffekte im Video

 

Die Herausforderung: genaue Interpretation des Moderatoreffektes

So weit, so gut. Die Schwierigkeiten beginnen oft damit, die Vorzeichen und Wirkungsrichtungen zu interpretieren. Der Effekt der unabhängigen Variablen ist nun nicht mehr allein an ihrem Koeffizienten abzulesen, sondern zusätzlich auch im Interaktionsterm enthalten. Was bedeuten die Ergebnisse nun genau?

Hier helfen grafische Darstellungen. Zunächst ein einfaches, konstruiertes Beispiel (ist nicht von mir, ich bin in einem Statistikforum darauf gestoßen). Nicht zur praktischen Nachahmung empfohlen!

Moderatoreffekt: nur mit Moderator übt die UV einen Effekt auf die AV aus
Moderatoreffekt: Feuerzeug, Benzin, Hautverbrennung; eigene Darstellung

Hier wird die Wirkungsweise eines Moderators hoffentlich noch deutlicher. Schüttet sich jemand Benzin (=unabhängige Variable, UV) auf den Arm, so resultiert daraus noch keine Hautverbrennung (=abhängige Variable, AV). Hält er sich jedoch zusätzlich ein Feuerzeug (Moderator) an den Arm, dann – Kawumm. Je nachdem, ob ein Feuerzeug verwendet wird oder nicht, bewirkt das Benzin einen sehr unterschiedlichen Effekt auf die Haut. (Das Feuerzeug allein wird zu einer gewissen Hautverbrennung führen, aber bei weitem nicht so schlimm wie mit Benzin. Man kann die beiden Effekte nicht getrennt von einander betrachten oder einfach addieren.)

Die Grafik zeigt, dass Benzin ohne Feuerzeug praktisch keinen Einfluss hat, mit Feuerzeug dagegen ein sehr starken.

Beispiel 1: Der Moderator verstärkt eine positive Beziehung

Nun gibt es verschiedene Möglichkeiten, wie Moderatoreffekte wirken können. Ein weiteres Beispiel:

Moderatoreffekt: Lernerfolg, Lernstunden, Entspannungstechnik

Abhängige Variable ist der Lernerfolg; UV: Lernstunden; der Einsatz einer Entspannungstechnik wirkt als Moderator. Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht: die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus. Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik beeinflusst. Mit anderen Worten: Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.

Beispiel 2: Der Moderator schwächt eine positive Beziehung ab

Hier geht es wieder um den Zusammenhang zwischen Lernstunden und Lernerfolg, Moderator ist diesmal jedoch der Alkoholkonsum.

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Diesmal schwächt der Moderator die positive Beziehung ab. Auch hier gilt: der Lernerfolg steigt mit steigender Anzahl der Lernstunden. Mit höherem Alkoholkonsum wird der Zusammenhang jedoch schwächer.

Beispiel 3: Der Moderator verstärkt einen negativen Zusammenhang

Im letzten Beispiel wird ein negativer Effekt nachgewiesen, der durch einen Moderator sogar noch verstärkt wird.

Moderatoreffekt: Ausdauer, Übergewicht, Rauchen

Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.

Übrigens: Findet man keinen Moderatoreffekt, so bedeutet das grafisch, dass die beiden Geraden parallel verlaufen. Alle Beispiele sind konstruiert und beruhen nicht auf realen Daten!

Zuletzt natürlich die Preisfrage: Wie macht man das? Am besten in R.

Es gibt praktische Excelvorlagen dazu, in die man nur die Modellkoeffizienten eintragen muss. Sogar die Interpretation ist vorbereitet, allerdings auf Englisch.

Fundstelle: StatWiki, Case Western Reserve University, Cleveland, Ohio [URL leider nicht mehr erreichbar]
Excel-Tool, two-way interactions
Weitere Informationen bei Jeremy Dawson.

Bei der Verwendung der Tools von Jeremy Dawson wird zwischen standardisierten und unstandardisierten Variablen unterschieden; StatWiki setzt standardisierte Variablen voraus (als ich das Tool heruntergeladen habe, stand dort der Hinweis „unstandardisiert“ – meines Erachtens ist das falsch!). Manche Autoren empfehlen Standardisierung (vor Berechnung des Interaktionsterms). Dadurch wird der Einfluss unterschiedlicher Skalierungen der Variablen neutralisiert. Ein typisches Beispiel bilden Geschlecht (zwei Ausprägungen) und Alter (z. B. von 18 bis 65). Nachteil der Standardisierung ist schwierigere Interpretierbarkeit: was bedeutet eine Einheit einer standardisierten Variable?

In beiden Fällen sind die unstandardisierten Regressionskoeffizienten (B, nicht beta) einzutragen. Bei unstandardisierten Variablen müssen zusätzlich Mittelwert und Standardabweichung eingetragen werden; bei z-standardisierten Variablen ist dies nicht notwendig, da der Mittelwert 0 beträgt und die Standardabweichung 1.

Viel Erfolg beim Interpretieren von Moderatoreffekten! Welche Erfahrungen haben Sie damit gemacht? Wenn Ihnen der Artikel weitergeholfen hat – bitte weitersagen!

Hier gibt es weitere Anregungen für die Visualisierung statistischer Daten.

Literaturtipps:

Introduction to Mediation, Moderation, and Conditional Process Analysis, Second Edition: A Regression-Based Approach (Methodology in the Social Sciences)
Discovering Statistics Using IBM SPSS
Discovering Statistics Using R

88 Gedanken zu „Moderatoreffekte interpretieren und grafisch darstellen“

  1. Lieber Wolf,
    ich hänge gerade am richtigen Vorgehen für die Moderation. Meine UV ist intervallskaliert, der Moderator dichotom (Geschlecht) und die AV intervallskaliert.
    1) Ist es korrekt, dass ich erst bei Feststellung von Multikollinearität zentriere?
    2) Bei der Zentrierung selbst: Wird die UV zentriert, der Moderator nicht, da dichotom (Hier jedoch umcodieren in 0 und 1, da bisher Mann 1 und Frau 2 codiert wird)?
    3) Werden Kontrollvariablen auch zentriert?

    Ganz viele Grüße 🙂
    Kristin

    1. Hallo Kristin,
      ich weiß nicht, ob es da eine einfache Richtig-Falsch-Antwort gibt. Zentrieren verändert die Interpretation (z. B. Konstante). Den dichotomen Moderator würde ich nicht zentrieren. Du kannst ja verschiedene Varianten vergleichen, um zu sehen, wie sich das jeweils auswirkt, wie sich die Modelle verändern, welches Bild sich für die Interpretation ergibt.
      Mir hat es geholfen, von der Denkweise „Ich will das eine richtige Modell finden“ zu der Denkweise überzugehen: Interessante Einblicke in meine Daten erhalte ich oft eher aus dem Vergleich verschiedener Modelle als aus dem „einen richtigen“ Modell.

  2. Lieber Herr Riepl,

    ich schreibe derzeit meine Bachelorarbeit und komme bei einer statistischen Fragestellung zur Moderatoranalyse nicht weiter:

    ich habe eine hierarchisch moderierte Regression mit Kontrollvariablen gerechnet und zuvor weder den Prädiktor noch die angenommene Moderatorvariable zentriert. Im Ergebnis waren die VIF-Werte > 10 relativ hoch.

    Im Anschluss habe ich zunächst die Moderatorvariable zentriert, was die VIF-Werte deutlich gesenkt hat. Im Ergebnis war im ersten Modell zunächst nur die angenommene Moderatorvariable signifikant. Mit Hinzunahme des Interaktionsterms im zweiten Modell waren weder die Moderatorvariable noch der andere Prädiktor oder der Interaktionsterm signifikant. Das blieb im dritten Modell mit Hinzunahme der Kontrollvariablen auch so.

    Wenn ich nun aber neben der Moderatorvariable auch den Prädiktor zentriere, ändert sich das Ergebnis. Die Moderatorvariable bleibt auch mit Hinzunahme des Interaktionsterms (Modell 2) und den Kontrollvariablen (Modell 3) signifikant, der Interaktionsterm sowie der andere Prädiktor sind nicht signifikant.

    Welches Vorgehen ist denn nun richtig? Muss ich (wenn ich zentriere), immer sowohl die Moderatorvariable als auch den Prädiktor zentrieren oder nur die Moderatorvariable?

    Ich tue mich auch mit der Ergebnisinterpretation schwer:
    eine Moderation liegt nicht vor, da der Interaktionsterm ja nicht signifikant ist. Wie interpretiere ich denn dann den signifikanten Einfluss der angenommenen Moderatorvariable in Verbindung mit dem anderen nicht-signifikanten Prädiktor? Das alles verwirrt mich zunehmend.

    Es wäre super, wenn Sie mir weiterhelfen könnten, da ich schon längere Zeit vergeblich nach einer Antwort in der Fachliteratur suche.

    Vielen Dank und Grüße
    Claudia

    1. Hallo Claudia,

      ich würde klären, worauf die hohen VIF-Werte (starke Multikollinearität) zurückzuführen sind. Zwischen welchen Variablen besteht die starke Korrelation? Moderator und Prädiktor? Prädiktor und Kontrollvariable(n)? Vielleicht ist eine Kontrollvariable verzichtbar, die ohnehin sehr stark mit anderen Merkmalen korreliert.

      Zum Zentrieren gibt es (leider) unterschiedliche Empfehlungen. Wahrscheinlich ist es besser, zuerst die Multikollinearität in den Griff zu bekommen, danach sollte die Modellierung / Interpretation einfacher werden. Durch Zentrieren ändert sich die Interpretation der Koeffizienten und der Konstante, da sich der 0-Bezugspunkt ändert.
      https://www.researchgate.net/post/While_testing_moderating_effect_is_it_necessary_to_center_the_variables

      Im Modell mit Interaktionsterm ist die Interpretation der einzelnen Koeffizienten schwierig: Der Effekt eines Prädiktors (der im Interaktionsterm enthalten ist – gilt für Prädiktor und Moderator) steckt nun nicht mehr in einem Koeffizienten allein, sondern in beiden gemeinsam: Der Variable „einzeln“ und dem Interaktionsterm.

      In Ihrem Fall klingt es so, als ob nur der Moderator einen (statistisch abgesicherten) Einfluss auf die abhängige Variable hat.

      Ich empfehle grafische Darstellungen, wenn möglich.

      Haben Sie auch Modelle ohne Interaktionsterm aufgestellt? Ich würde alle vergleichen: 1. Nur Prädiktor, 2. nur Moderator, 3. Prädiktor und Moderator, aber ohne Interaktionsterm, 4. Volles Modell mit Prädiktor, Moderator und Interaktionsterm.

      Viel Erfolg
      Wolf

      1. Hallo Herr Riepl,

        vielen Dank für Ihre Hinweise! Das hilft mir bereits weiter. Nur bin ich ratlos, was für eine grafische Darstellung in diesem Fall hilfreich wäre.

        Ich habe vor den eigentichen Hypthesentestungen eine Korrelationsanalyse der beteiligten Variablen durchgeführt. Hier waren keine extremen Korrelationen zu erkennen. Die höchste Korrelation bestand zwischen dem Prädiktor und der angenommenen Moderatorvariable (-.350).
        Der VIF-Wert der Moderatorvariable liegt ohne die Zentrierung breits im ersten Modell – also nur Prädiktor und Moderatorvariable – bereits über 10.
        Wenn ich allerdings den Moderator zentriere, liegen die VIF-Werte im gesamten Modell bei unter 5. Demnach muss ich wohl den Moderator zentrieren, da ich die Multikolleniarität auf keinem anderen Weg reduzieren kann. Ich habe im ersten Modell ja nur zwei Variablen und diese benötige ich beide für die Hypothese.

        Es stimmt, dass bislang nur die angenommene Moderatorvariable einen signifikanten Einfluss hat. Je nachdem, ob ich ebenso den Prädiktor zentriere, verschwindet dieser signifikante Einluss aber mit Aufnahme des Interaktionsterms.
        Ist es mögich, dass primär ein nicht-linearer Zusammenhang vorliegt und ich es nur nicht merke?

        Bisher habe ich die hierarchische Regression wie folgt aufgebaut:
        Modell 1: Prädiktor und angenommene Moderatorvariable
        Modell 2: Prädiktor, angenommene Moderatorvariable und Interaktionsterm
        Modell 3: Prädiktor, angenommene Moderatorvariable, Interaktionsterm und Kontrollvariablen

        Viele Grüße
        Claudia

        1. Hallo Claudia,
          es gibt manchmal Fälle von Multikollinearität „in höheren Dimensionen“, die sich nicht an der Korrelationstabelle zwischen jeweils zwei Variablen zeigt. Z. B. Variablen x1 und x2 korrelieren gemeinsam (aber nicht so stark einzeln) mit x3. Das ist hier aber wohl nicht der Fall, zumindest spricht Ihre Beschreibung von Modell 1 dagegen.
          Nichtlinearität könnte eine Erklärung sein für den hohen VIF-Wert im ersten Modell.
          Das könnten Sie untersuchen: z. B. vergleichsweise mit einem Modell mit quadratischem Term, oder grafisch mit einem Streudiagramm mit Lowess-Anpassungskurve.
          Das nur als Möglichkeit – vielleicht genügt es auch, die Befunde sorgfältig zu beschreiben und bestmöglich zu interpretieren. Neulich sagte ein Kursteilnehmer so schön: Das Problem sind ja nicht die Modelle, das Problem ist die Realität …
          Zur ersten Frage, welche Grafik? Vorschlag: Abhängige Variable auf der y-Achse, Prädiktor auf der x-Achse, Regressionsgeraden für hohe und niedrige Ausprägung des Moderators.

          1. Lieber Herr Riepl,

            vielen Dank für Ihre Erklärung. Da wir uns im Bachelorstudiengang nicht mit Nichtlinearität beschäftigen, werde ich wohl bei der ausführlichen Befundbeschreibung bleiben (auch, wenn es mich schon interessieren würde). Aber allein die Erklärung, dass Nichtlinearität hierfür verantwortlich sein könnte, bringt mich um einiges weiter.
            Vielen Dank dafür!

  3. Werter Herr Riepl,
    ich bin derzeit am Schreiben meiner Abschlussarbeit und möchte untersuchen, ob und inwiefern durch die Produktpräsentation eines Influencers (im Vgl. zu einem normalen Werbebanner) die sensorische Wahrnehmung von Produkteigenschaften beeinflusst werden kann und ob diese Form der Produktpräsentation einen Einfluss auf bestimmte Konsumentenreaktionen (Kaufabsicht etc.) besitzt. in diesem Zuge habe ich 3 Moderatorvariaben identifizieren können: Vertrauen, Authentizität und Glaubwürdigkeit. Nun stellt sich mir die Frage wie ich den Einfluss jeder einzelnen Moderatorvariablen auf bestimmte Konstrukte untersuchen kann.

    Kurz zur Veranschaulichung des Effektes, den ich untersuchen möchte:

    Produktpräsentation des Influencers —————-> z.B. Kaufabsicht [auf diesen Wirkungszusammenhang wirkt nun eine der drei Moderatorvariablen, nehmen wir an Vertrauen]

    abhängige Variable: Kaufabsicht

    Da allerdings meine unabhängige Variable nun die Produktpräsentation (PP) ist, die in meinem Fragebogen randomisiert zugelost wurde (Ausprägungen: 1=Influencer-PP; 2=Werbebanner PP) bin ich mir ziemlich unschlüssig wie ich ich dort jetzt den Moderatoreffekt bzw. Interaktionseffekt des Vertrauens berechnen kann. Alle anderen Konstrukte habe ich mithilfe von Multi-Itemskalen (Likert) gemessen.

    Ich freue mich auf Ihre Antwort und Lösungsvorschlag

    Mit freundlichen Grüßen

    1. Hallo Matthias,
      wenn ich es richtig verstehe, ist der Knackpunkt: Wie kann die Produktpräsentation mit zwei Ausprägungen in den Moderatoreffekt eingehen? Technisch ist der Interaktionsterm das Produkt aus UV und Moderator: ganz wörtlich die Multiplikation der beiden Variablen. Das gilt auch für Variablen mit nur zwei Ausprägungen, auch wenn das „komisch“ aussieht.
      Die konkrete Umsetzung kann in verschiedenen Statistikprogrammen unterschiedlich sein. In SPSS habe ich früher eine neue Variable berechnet, die buchstäblich die Multiplikation der beiden Variablen (UV und Moderator) enthielt:
      z. B. Interaktionsterm = Produktpräsentation mal Vertrauen.
      Empfohlen wird dann, sowohl den Interaktionsterm als auch die beiden Variablen einzeln in das Modell aufzunehmen.
      z. B. Kaufabsicht = Vertrauen + Produktpräsentation + Interaktionsterm

      In R muss man dem Datensatz keine neue Variable hinzufügen, man kann die Interaktion direkt in der Modellformel angeben.
      Kurzschreibweise: Modell <- lm(Kaufabsicht ~ Vertrauen:Produktpräsentation) Gleichbedeutend mit: Modell <- lm(Kaufabsicht ~ Vertrauen + Produktpräsentation + Vertrauen * Produktpräsentation) Hoffe das hilft - viel Erfolg! Wolf

  4. Lieber Herr Riepl,
    Ich schreibe gerade an meiner Masterarbeit und hätte eine Frage an Sie. Ich weiß, dass bereits ähnliche Fragen gestellt wurden, kann die Antworten aber leider nicht auf meine Daten anwenden… Vielleicht können Sie mir ja weiterhelfen.

    Ich möchte untersuchen ob der Einfluss von Agilem Arbeiten (UV, metrisch) auf Projekterfolg (AV, metrisch) durch das Erfüllen verschiedener Projekteigenschaften (Moderator, kategorial mit 3 Stufen) moderiert wird. Dafür habe ich den Moderator schon in 2 Dummy-Variablen kodiert. Ich bin mir jedoch nicht sicher wie ich weiter vorgehen soll.

    Bilde ich nun 2 Interaktionsterme (also aus Agilität x jeweilige Dummy Variable)? Und füge ich dann in mein Regressionsmodell beide Interaktionsterme ein, oder rechne ich ein getrenntes Modell für jeden Dummy-Moderator?
    Weiterhin bin ich mir nicht sicher, was eine signifikanter Einfluss eines Interaktionstermes dann genau aussagen würde.

    Vielen Dank im Voraus für Ihre Hilfe!

    Liebe Grüße
    Timo

    1. Hallo Timo,
      ich würde es vermeiden, mehr als einen Moderator im gleichen Modell zu haben. Mit einem Moderator ist es ja schon so, dass der Effekt einer Variablen nicht mehr nur an einem Term abzulesen ist, sondern an zweien: Der Variable einzeln und dem Interaktionsterm. Bei mehr als einem Interaktionsterm gibt es noch mehr Wechselwirkungen und damit Kombinationsmöglichkeiten und ich fände die Interpretation mehr als herausfordernd. Muss gestehen, dass ich seit einer Weile keine konkreten Projekte mit komplexeren Wechselwirkungen bearbeitet habe. Vielleicht lohnt sich ein Blick auf aktuelle Literatur dazu.
      Ich würde zwei Modelle aufstellen, vergleichen und diskutieren. Wenn ein drittes (mit der dritten Ausprägung der Projekteigenschaften) zusätzliche Erkenntnis bringt, dann das mit verwenden.
      Generell finde ich die Interpretation grafisch einfacher als nur numerisch.
      Viel Erfolg!
      Wolf

  5. Lieber Wolf
    Eine sehr interessante Seite! Ich hab dazu noch eine Frage: Ich bin zurzeit an der Auswertung meiner Daten anhand eines multiplen Regressionmodells. Nun habe ich den Interaktionsterm eingefügt, welche nucht signifikant ist. Dennoch möchte ich diesen grafisch darstellen. Wie kann ich eine solche Grafik ich R erstellen bzw. welchen Code/Befehl hast du für deine Grafiken verwendet?

    Vielen Dank für deine Hilfe!
    Liebe Grüsse aus der Schweiz
    Michelle

    1. Hallo Michelle,
      ich habe ggplot2 verwendet. Um die Interaktion zu zeigen, würde ich Gruppen als Ästhetik definieren (z. B. Farbe) und dann Anpassungsgeraden mit geom_smooth einfügen. geom_smooth „erbt“ die Ästhetiken und erstellt automatisch zwei Geraden, wenn es zwei (Farb-)Gruppen gibt.

      Beispiel – Code bitte für Deinen Anwendungsfall anpassen:

      library(MASS)
      data(Boston)
      library(ggplot2)

      ggplot(Boston, aes(x = lstat, y = medv, color = factor(chas))) +
      geom_point(alpha = 0.8) +
      geom_smooth(method = „lm“, se = FALSE) +
      labs(x = „Bevölkerungsanteil mit niedrigem Status in Prozent“,
      y = „Median Wohnungspreis in 1.000 USD“,
      title = „Modell: lm(medv ~ lstat * chas, data = Boston)“) +
      scale_color_discrete(name = „Lage am Charles River?“) +
      theme(legend.position = „bottom“)
      ggsave(„lm_mit-Interaktion.png“)

  6. Guten Tag

    Eine wunderbare Seite:)
    Ich habe eine Frage, deren Antwort ich trotz Recherche immernoch nicht beantworten konnte…
    Ich habe eine nominal skalierte Moderatorvariable, welche nicht dummy ist, sondern 6 Ausprägungen annehmen kann (sozialdemokratisch, liberal, etc..) … die OLS-Regression konnte ich bereits rechnen in R. Nun weiss ich jedoch nicht, wie ich dies zu interpretieren habe.

    Vielen Dank im Voraus 🙂
    Zora

    1. Hallo Zora,
      weiß R, dass die Variable nominalskaliert ist? Du kannst sie als Faktor definieren – wie sieht es dann aus?
      Ich denke als Moderatoreffekt mit 6 Ausprägungen wird die Interpretation eher kompliziert. Ich würde das wohl in Zweier-Gegensatzpaare aufteilen, z. B. sozialdemokratisch ja/nein in einem Modell. Wenn alle Modelle wichtig sind, dann eben für jede Ausprägung ein Modell: liberal ja/nein als Moderator, usw.
      Wolf

      1. Lieber Wolf

        Vielen Dank für die schnelle Antwort:)

        ja ich habe die Variable als Faktor definiert:

        WFS_R = as.factor(c(„Sozialdemokratisch“, „Sozialdemokratisch“,“Konservativ“, „Post_Communist“, „Konservativ“,
        „Former_UdssR“, „Mediterran“, „Konservativ“, „Konservativ“, „Liberal“,
        „Post_Communist“,“Liberal“, „Mediterran“, „Former_UdssR“, „Sozialdemokratisch“, „Sozialdemokratisch“,
        „Post_Communist“, „Mediterran“, „Sozialdemokratisch“ ))

        Das habe ich mir auch überlegt, aber dann kann ich ja nur die Unterschiede betrachten und nicht ob die Interaktion signifikant ist? So wie ich meinen Output interpretiere, nimmt es einfach eine Ausprägung (Former_UdssR) als Referenzkategorie. Heisst das, dass ich einfach nur mit einer Ausprägung vergleichen kann?

        1. R behandelt die Variable im Modell nun so, als ob sie dummy-codiert wäre. Bei Dummy-Codierung „per Hand“ müsstest Du auch eine Variable weglassen und als Referenzkategorie interpretieren. Du kannst den Effekt jeder Kategorie im Vergleich zur Referenzkategorie interpretieren.
          Gibt es keine zusätzlichen Terme für die Interaktion?

          1. Hmm.. Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?

            Doch den gibt es:
            OLS_Reg1 <- lm(Einst_Immigr ~ election + WFS_R + election * WFS_R, df_country)

            R gibt mir auch signifikante Werte aus.
            Das ist der Output von der OLS-Regression:

            Einfluss von RPP auf Einstellung und WFSR

            Dependent variable:

            Einst_Immigr

            election 7.259**
            (2.981)

            WFS_RKonservativ 0.635**
            (0.232)

            WFS_RLiberal 0.620**
            (0.232)

            WFS_RMediterran 0.636**
            (0.232)

            WFS_RPost_Communist 0.543*
            (0.233)

            WFS_RSozialdemokratisch 0.654**
            (0.232)

            election:WFS_RKonservativ -7.325**
            (2.983)

            election:WFS_RLiberal -7.410**
            (2.988)

            election:WFS_RMediterran -8.988**
            (3.034)

            election:WFS_RPost_Communist -7.299**
            (2.982)

            election:WFS_RSozialdemokratisch -7.528**
            (2.983)

            Constant 0.107
            (0.231)

            Observations 19
            R2 0.918
            Adjusted R2 0.789
            Residual Std. Error 0.019 (df = 7)
            F Statistic 7.106*** (df = 11; 7)

            Note: *p**p***p<0.01

          2. Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?
            Man kann vergleichen, wie jede Kategorie im Verhältnis zur Referenzkategorie dasteht. Ein Jeder-mit-jedem-Vergleich (ähnlich post-hoc bei ANOVA) ist hier nicht vorgesehen.

            Das Modell halte ich für schwer interpretierbar. Jeder Effekt ist zu interpretieren unter der Prämisse, dass alle anderen Effekte konstant gehalten werden. Das ist jedoch problematisch, da die Interaktionseffekte nicht von einander unabhängig sind. Das heißt: Die Effekte werden anders aussehen, wenn man separate Modelle aufstellt mit jeweils nur einem Interaktionsterm. Es gibt im obigen Modell sehr viele Wechselwirkungen, die sich gegenseitig beeinflussen.

  7. Hallo Zusammen,

    ich habe zur Identifikation verschiedener Prädiktoren und Moderatoren lineare bzw. multivariate Regressionen gerechnet. Jetzt hat meine Betreuerin gesagt, dass ich das Ganze anhand eines Pfadmodells prüfen soll. Für die Prädiktoren (insgesamt 5) habe ich ein Pfadmodell erstellt, es gibt mir allerdings keine Angaben zum Chi2 sowie dem Modelfit (RMSEA) aus. Ich habe gelesen, dass das daran liegen kann, dass das Modell zu klein ist?! Eine Bekannte hat ein größeres Modell und nutzt den selben R-Befehlt und bekommt alle Werte ausgegeben. Kann es also daran liegen, dass es mit diesem Modell nicht möglich ist Werte angegeben zu bekommen?
    Außerdem frage ich mich mittlerweile, ob ihr Kommentar bezüglich des Pfadmodells ausschließlich auf die Prädiktoren bezogen war. Ich habe viel gelesen zu Pfadmodellen und immer nur Beispiele zur Mediation gefunden. Mittlerweile bin ich daher fast sicher, dass eine Moderation nicht in einem Pfadmodell getestet werden kann, da der Moderator eine UV ist. Oder gibt es dafür eine Möglichkeit, die mir nicht bekannt ist und selten verwendet wird (daher online nicht auffindbar)?

    Für die Prädiktoren habe ich mir außerdem die Kovarianzen ausgeben lassen, finde aber keine Information dazu ab wann Variablen „hoch“ kovariieren. Ich weiß, dass ein Wert nahe 0 sehr gut ist, aber wie sieht es beispielsweise mit Werten wie 0.56 aus?

    Vielen Dank bereits im Voraus für ihre Antwort.

    1. Hallo Ben,
      sorry, eine Ferndiagnose zu dem Pfadmodell kann ich leider nicht stellen.
      Kovarianzen sind von Einheiten der verwendeten Variablen abhängig und damit meines Erachtens nicht allgemeingültig interpretierbar. Standardisierte Maße wie Korrelationskoeffizienten sind dafür besser geeignet. Allerdings sind auch dann Zusammenhänge im Forschungskontext zu betrachten. Bei einer sozialwissenschaftlichen Fragestellung bewerte ich eine Korrelation anders als bei einer technischen Fragestellung (z. B. Produktionsprozess), bei der nicht gemessene Einflüsse viel besser kontrolliert werden können.

      1. Hallo,

        vielen Dank für die Antwort.
        Wissen Sie denn ob es generell möglich ist eine Moderation mit einem Pfadmodell zu testen?
        In allen Beispielen zur Moderation die ich gefunden habe werden immer nur Regressionen gerechnet..

  8. Guten Tag.

    Ich führe zum ersten Mal eine quantitative Analyse (Moderatoranalysen) durch und habe eine Frage bezüglich R-Studio:
    Meine AV, einige meiner UV und einige meiner potentiellen Moderatoren sind nicht normal verteilt. Wie gehe ich damit um? Kann ich die Moderatoranalyse trotzdem durchführen oder muss ich vorher einige Schritte durchführen? Ich habe z.B. von Bootstrapping gehört und bin unsicher, ob das in diesem Fall angebracht ist und wie man dies in R-Studio durchführt.

    Vielen Dank für Ihre Hilfe.
    Mfg Jule

    1. Hallo Jule,

      fehlende NV: schwer, das pauschal zu beantworten. Einige Anhaltspunkte: Je größer die Stichprobe, desto weniger fallen Abweichungen von der NV ins Gewicht. Wie wurde die fehlende NV ermittelt – per statistischem Test oder (auch) grafisch? Tests wie Shapiro-Wilk (oder auch Kolmogorov-Smirnov) werden gerade bei größeren Stichproben „leichter“ signifikant. Wenn die Abweichungen nicht allzu drastisch sind, kann man das dokumentieren und die Analysen dennoch durchführen – es gibt es etwas Ermessensspielraum und bei vielen Studien sind nicht alle Testvoraussetzungen streng erfüllt.

      Zum Bootstrapping: Da gibt es das Boot-Paket in Base R (Teil der Standard-Installation). Man schreibt die Analyse als Funktion und lässt diese Funktion „bootstrappen“, also z. B. 1000 Mal mit Zufallsstichproben mit Zurücklegen aus dem Datensatz schätzen. Dann erhält man Verteilungen der Kennwerte, die oft brauchbarer (realistischer) sind als Kennwerte, die mit statistischen Formeln geschätzt werden. Gibt Anleitungen zum Vorgehen im Netz.

      1. Hallo,

        vielen Dank für die schnelle Antwort.
        Mein Datensatz umfasst 284 Teilnehmer, er sollte eigentlich groß genug sein.
        Die Normalverteilung habe ich durch Histogramme sowie den Shapiro-Wirk Test beurteilt.
        Im Fall der Variable „sozialer Druck“ liegt er beispielsweise bei .0049 (was wahrscheinlich noch okay ist), während bei einigen anderen Variablen ein z.B. p-Wert von 6.184e^-07 ausgegeben wird. Die AV, auf welche mehrere UV und Moderatoren getestet werden, ist laut meinem Histogramm ebenfalls nicht normal verteilt und erhält den p-Wert 2.676e^-10 (welcher laut Google als p = .121 berechnet wird).

        Denken Sie bootstrapping ist in diesem Fall angebracht, um eine Normalverteilung zu generieren? Ich bin heute erst auf dieses Problem gestoßen und finde leider aktuell keine Antworten darauf, wann man bootstrapping durchführt und wann nicht. Soweit ich es verstanden habe, ist es allerdings eine Möglichkeit Probleme wie die ungleiche Verteilung zu umgehen. Anderseits kenne ich mich leider kaum in R aus, sodass ich unsicher bin, ob dies meine Kompetenzen nicht übersteigt.

        Vielen Dank für Ihren Rat.
        Mfg

        1. Achtung, 2.676e-10 = 0.0000000002676. Das ist keine „e-Funktion“, sondern sog. wissenschaftliche Notation. Die Zahl nach dem e gibt die Anzahl der Dezimalstellen an.
          Ich würde nicht nur auf p-Werte schauen. Wenn die Verteilungen optisch einigermaßen vertretbar sind, ist es ok. Histogramme können auch etwas irreführen, da sie von der Breite der Kategorien abhängig sind. (Kann man variieren, um einen besseren Eindruck zu bekommen.)
          Bootstrapping generiert keine Normalverteilung. Es hilft lediglich, Verteilungen von Parametern (z. B. Konfidenzintervalle) ohne ohne Annahmen über Verteilungen der Variablen zu schätzen. Die Schätzung erfolgt nicht auf Basis von Formeln (die bestimmte Verteilungen voraussetzen), sondern in Form einer Simulation. So, als ob man eben zum Beispiel 1000 Stichproben hätte statt nur einer.

          1. Ah okay, das heißt 3.151e-06 = 0,000003151 ?!
            Ich habe gedacht die p-Werte seien gerade deswegen relevanter, da die Histogramme optisch oft täuschen.
            Ich finde es allerdings irritierend, dass das Histogramm normal verteilt wird und der Shapiro-Wirk Test eine hohe Signifikanz verzeichnet.

            Wenn ich das richtig verstehe, kann ich die moderierte Regression also einfach rechnen ohne auf eine Alternative wie das Bootstrapping-Verfahren zurückzugreifen :).

            Da ich noch nie quantitativ geforscht habe und keine Hilfestellung der Uni erhalte, habe ich ziemliche Angst, dass mir ein Fehler unterläuft und nachher die Ergebnisse alle „falsch“ bzw. nicht interpretierbar sind.

            Mfg
            Jule

          2. 3.151e-06 = 0,000003151 Ja

            Kann man in R testen:
            3.151e-06 == 0.000003151
            [1] TRUE

            Die p-Werte sind tendenziell zu streng bei größeren Stichproben (N=284 zähle ich dazu). Ich würde die p-Werte der NV-Tests dokumentieren und diskutieren.
            Und ja, ich denke die Regression ist vertretbar.
            In der Statistik gibt es viele Ermessensspielräume, es geht mehr um Wahrscheinlichkeiten und Annäherungen und nicht um exakte Wahrheit – die findet man statistisch nicht. Daher ist es wichtiger, das Vorgehen gut zu dokumentieren. Es dürfte kaum eine Studie geben, die „perfekt“ ist in dem Sinne, dass alle Voraussetzungen exakt erfüllt werden. Wichtiger ist, dass man mit Bewusstsein für Möglichkeiten und Grenzen der Methoden vorsichtig interpretiert.
            Es hört ja nicht auf bei den Normalverteilungen. Die meisten Zusammenhänge sind „in Wirklichkeit“ nicht linear. Dennoch sind lineare Regressionsmodelle sinnvolle und nützliche Werkzeuge.
            „Alle Modelle sind falsch, aber manche sind nützlich.“ (All models are wrong, but some are useful.)

  9. Hallo.
    Ich teste zurzeit mehrere Moderationen.
    Es geht um unter anderem darum, ob Need to Belong (Moderator) den Zusammenhang zwischen Selbstkontrolle (UV) und Social Media-Prokrastination (AV) moderiert. Die Analyse findet in R statt und ich habe bereits die notwendigen Befehle.
    Meine Frage: Ich habe ein Referat einer Moderationsanalyse in dem nicht auf Kontrollvariablen getestet wird.
    Ist das üblich oder sollte ich Variablen wie Alter, Geschlecht etc. definitiv in das Regressionsmodell einfließen lassen?

    Vielen Dank
    Ismail

    1. Deine Entscheidung 🙂
      Genauer hinzuschauen und Kontrollvariablen zu testen ist keine schlechte Idee. Allerdings muss man entscheiden, wo man die Grenze zieht … Man könnte auch noch Wechselwirkungen (Interaktionen) testen oder nichtlineare Zusammenhänge – es gibt da viele Möglichkeiten und man wird nicht alle abdecken können. Meine Empfehlung ist, theoriegeleitet vorzugehen (und nicht „auf Verdacht“ ganz viel zu testen). Gibt es Gründe für die Annahme, dass Alter oder Geschlecht eine Rolle spielen?

      Oft ist es besser, sich etwas weniger vorzunehmen und das dafür sorgfältig auszuarbeiten, anstatt sich mit zu vielen Ideen zu verzetteln …

      1. Vielen Dank für die schnelle Antwort!
        Es gibt in der Theorie nicht wirklich Indikatoren für mögliche Kontrollvariablen. Also werde ich da auf jeden Fall weniger testen als zunächst überlegt.

        Ich habe noch eine Frage bezüglich der Voraussetzungen die zu testen sind.
        Bevor ich die Moderationen teste, untersuche ich den Zusammenhang zwischen der UV und AV.
        Ich versuche so Prädiktoren für Social Media-Prokrastination zu identifizieren.
        Nachdem ich eine bivariate Regression durchgeführt habe, die einen hohen signifikanten Zusammenhang zwischen habitualisierter Nutzung so Social Media-Prokrastination zeigt, habe ich nun die Voraussetzungen getestet.
        Der breusch-pragan Test hat jetzt ergeben, dass p < .005 ist und entsprechend Heteroskedastizität vorliegt.
        Ich weiß allerdings nicht wie ich damit nun umgehen muss.

        Danke schon einmal im Voraus !

        1. Vielleicht kannst Du herausfinden, woran es liegt. Wie sieht das Streudiagramm aus? Vielleicht ist der Zusammenhang nichtlinear? Wie sind die Residuen im Moderator-Modell verteilt – vielleicht sieht es da besser aus? Hat eine weitere Variable im Datensatz einen starken Einfluss, sodass ein Modell mit dieser Variablen besser aussieht?
          Auch wenn Du keine exakte Antwort herausbekommst, warum Heteroskedastizität vorliegt: Ergebnis dokumentieren und diskutieren.

          1. Okay, vielen Dank :).
            Ich kann die Analyse also trotzdem so durchführen und muss das Ganze nur am Ende diskutieren und versuchen einzuordnen? Ich habe nämlich befürchtet die Analyse jetzt nicht durchführen zu dürfen etc.

          2. Voraussetzungen sind oft verletzt … Schöner ist es natürlich, wenn man die Ursache findet und womöglich sogar beheben kann. Vielleicht liegt es auch an einzelnen Ausreißern …

  10. Vielen Dank für diesen ausführlichen Beitrag! Mein Datensatz erfüllt die Voraussetzungen nicht. Ich habe statt ANOVA und Pearson, Mann-Whitney Test gemacht und lineare multiple Regression berechnet mit dem Vermerk, dass es mir um reine Unterschiede geht. Soweit war mein Professor damit einverstanden. Bei der Moderation empfiehl er mir die Z standardisierte Variablen zu erstellen und damit rechnen. Ich habe aber keine Normalverteilung in den Residuen und sonst auch keine Normalverteilung. Also habe ich meine Variablen nicht mittelwertzentriert. Können Sie mir helfen das zu begründen? Denn bei der Zentrierung werden die Werte nur im Wertebereich um 1 bis -1 variieren, ansonsten ändert sich ja nicht viel. Er meinte, ich habe dann das Problem das ganze sinnvoll zu interpretieren. Mein Moderator ist dichotom, AV ist quasimetrisch, es kam raus, dass Interaktionseffekt signifikant von null verschieden ist. Ich möchte damit nur zum Ausdruck bringen, dass eine Kategorie trägt zur Erklärung der Varianz mehr bei als andere Kategorie. Deswegen habe ich es so begründet, dass die Haupteffekte nicht zu interpretieren sind und die Ergebnisse sind eher heuristisch zu betrachten. Kann ich das so machen und mit einer Quelle begründen, wenn ja mit welcher? Ich habe leider nichts gefunden.

    Vielen Dank! Und viele Grüße!

  11. Hallo Wolf,

    in meiner Moderatoranalyse ist die Interaktion nicht signifikant. Die Moderatorvariable und die Prädiktorvariable jedoch schon. Wie interpretiere und berichte ich dies nun richtig? Ein Moderatoreffekt liegt also nicht vor, da der Interaktionsterm nicht signifikant ist, richtig? Vielen Dank und viele Grüße, Max

    1. Hallo Max,
      ja, das klingt plausibel. Das heißt: Der Effekt des Prädiktors hängt nicht von der Ausprägung der Moderatorvariable ab. Anders formuliert: Es gibt keine Wechselwirkung zwischen Moderator und Prädiktor.
      Viel Erfolg und viele Grüße,
      Wolf

  12. Zunächst vielen Dank ihnen für ihre tollen Erklärungen.Allerdings habe ich noch eine Frage, auf die ich auch in den Kommentaren hier noch keine Antwort gefunden habe:

    Ich rechne zur Zeit ein Modell mit einem Interaktionseffekt. Einer meiner Haupteffekte und der Interaktionseffekt sind signifikant. Der andere Haupteffekt ist nicht signifikant.
    Was bedeutet dies für die Interpretation meines Modells?

    1. Hallo Justus,
      es gibt eine signifikante Wechselwirkung (Interaktion) zwischen den beiden Variablen, die den Interaktionsterm bilden. D. h. der Effekt der einen UV hängt vom Zustand der anderen UV ab. Darüber hinaus würde ich die beiden Haupteffekte im Modell beschreiben (einer sig., einer nicht). Wenn Du es ausführlicher machen willst, kannst Du noch zusätzlich ein Modell ohne Interaktionsterm aufstellen und die Ergebnisse vergleichen.
      Viele Grüße!
      Wolf

  13. Ich hätte auch eine Frage:

    In meiner Bachelorarbeit ist mein Modell signifikant, aber die einzelnen Parameter und die Interaktion nicht. Wie interpretiere ich dies nun ??
    Vielen Dank schonmal!!

    1. Hallo Carlotta,
      „Modell sig.“ heißt Anova (F-Test) insgesamt für alle Variablen sig., aber keine unabhängige Variable inklusive Interaktionsterm? Formulierungsvorschlag: Alle Variablen GEMEINSAM leisten einen signifikanten Erklärungsbeitrag, wobei kein einzelner Prädiktor signifikant wird. Ein Interaktionseffekt konnte nicht nachgewiesen werden.

      Das Modell ist insgesamt signifikant „besser“ als das Null-Modell ganz ohne Prädiktoren (das immer den Mittelwert der abhängigen Variable voraussagt). Jeder Prädiktor für sich genommen bleibt aber unter der Signifikanzschwelle.

  14. Hallo, vielen Dank für die ausführlichen Erläuterungen. Diese waren sehr verständlich und gut erklärt!
    Ich hätte noch eine weitere Frage:
    Ich gehe hypothethisch von einem negativen Effekt von UV1 auf die AV aus. Parallel dazu gehe ich auch von einem negativen Effekt von UV2 auf die AV aus. Zusätzlich gehe ich davon aus, dass der negative Effekt von UV1 auf die AV noch stärker, also noch negativer wird, wenn UV2 ansteigt. Also im Prinzip genauso wie in deinem dritten Beispiel.

    Frage: Ich habe einen Interaktionsterm (UV1 * UV2) kreiert und teste diesen via Regression auf AV. Gehe ich davon aus, dass das Vorzeichen des Interaktionskoeffizienten jetzt positiv oder negativ ist?

    In meinem Fall ist er nämlich negativ. Das verwirrt mich. Hätte gedacht, dass ich von einem positiven Interaktionseffekt ausgehe, da die Wirkung doch verstärkt wird (im Sinne von minus mal minus gleich plus).

    Liebe Grüße,
    Sebastian

      1. Das mache ich auch in der Arbeit. Meine graphische Darstellung sieht genauso aus, wie ihr drittes Beispiel. Allerdings habe ich eben auch genau diesen Interaktionseffekt in einem hierarchischen Multilevel Regressionsmodell. Und dort ist mein Interaktionskoeffizient negativ. Und das verwirrt mich.

        Anders gefragt: Ich geh von dem dem dritten Beispiel auf dieser Seite aus: „Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.“
        Wäre das Vorzeichen der Interaktion (wenn ich Nichtraucher oder Raucher mal nicht als Dummy, sondern als metrische Variable, z.B. gerauchte Zigaretten am Tag, abbilden würde) „Gerauchte Zigaretten am Tag“ x „Übergewicht“ positiv oder negativ?

        1. Das mag ich nicht so pauschal beantworten. Es hängt von allen Variablen im Modell ab, nicht vom Interaktionseffekt allein. Ggf. einfach anfangen und schrittweise Variablen aufnehmen. Jede Korrelation zwischen UVs kann die Effekte verändern.

          1. Okay, dann noch einmal anders gefragt 🙂
            Bedeutet ein negatives Interaktionsvorzeichen bei zwei Variablen die einen negativen Effekt auf die AV haben, dass der Einfluss von UV1 sich mit ansteigender UV2 näher in Richtung 0 oder negativer (im Sinne von stärker in Richtung – unendlich) verschiebt?

            Beide Variablen sind nicht Teil des spezifischen Modells.

          2. Die grafische Darstellung müsste die Frage beantworten … In der linearen Regression sind wir bei Geraden. D. h. die Gerade wird nicht bei 0 „abknicken“ – sie kann nur steigen oder fallen, oder parallel zur x-Achse verlaufen.

  15. Hallo Herr Riepl,

    erstmals vielen Dank für das verständliche Aufbereiten dieses Themas. Dadurch ist es mir, einem Anfänger in Sachen Statistik, gelungen, die Ergebnisse einer Moderatoranalyse zu visualisieren.

    Nun stelle ich mir jedoch die Frage, wie ich die Stärke des Moderatoreffektes quantifizieren kann.

    Beispiel: Anhand der Grafiken sehe ich zwar, dass der Moderator den positiven Zusammenhang zwischen meiner UV und AV abschwächt, jedoch würde ich gerne präzise feststellt, wie stark der Zusammenhang abgeschwächt wird. Können Sie mir weiterhelfen und sagen, woher ich die Stärke des Effektes entnehmen kann?

    Danke und viele Grüße

    1. Hallo Patrick,
      Sie können den Rückgang des Regressionskoeffizienten B der UV sowie die Veränderung des p-Wertes der UV beschreiben. Vergleichen Sie dazu das Modell ohne Interaktionsterm mit dem Modell mit Interaktionsterm. Dazu können Sie die Veränderung in R² ergänzen. Es gibt weitere Gütemaße wie AIC oder BIC.
      Zu Effektstärken gibt es eine Menge Literatur. Man kann aus einem R² Cohen’s f² berechnen, z. B. hier:
      https://www.danielsoper.com/statcalc/calculator.aspx?id=5
      Sie können beschreiben, wie f² ansteigt, wenn der Moderatorterm aufgenommen wird.

  16. Hallo Wolf,

    ich bin glaube ich gedanklich noch nicht so weit wie der Rest hier. Ich habe eine Umfrage erstellt mit einer 5-stufigen Likert Skala. 15 Fragen zum Thema Bewertung einer Führungskraft entlang eines Ideals, 6 Fragen zum Respekt ggü der Führungskraft. Der Moderator (auch 15 Fragen) ist die Eigenbewertung des Mitarbeiters über sich selbst über die Kriterien, die bereits bei der unabhängigen Variable genutzt wurden. Und ich würde eben gerne untersuchen, ob der Zusammenhang zwischen der Wahrnehmung der aktuellen Führungskraft als ideale Führungskraft und dem Respekt gegenüber dem aktuellen Vorgesetzten umso größer ist je mehr sie Eigenbewertung des Mitarbeiters der idealen Führungskraft entspricht. Muss ich nun mehrere Regressionen rechnen um die Tabelle von Jeremy Dawson füllen zu können? Die unteren 5 Zeilen sind klar, aber ich hab keine Ahnung was ich machen muss. Oder bin ich völlig auf dem falschen Weg?

    Unstandardised Regression Coefficients:
    Independent variable:
    Moderator:
    Interaction:

    Intercept / Constant:

    Means / SDs of variables:
    Mean of independent variable:
    SD of independent variable:
    Mean of moderator:
    SD of moderator:

    Vielen Dank für deine Hilfe.

    1. Hallo Sabine,
      wenn Du nicht sehr viele Modelle aufstellen willst, solltest Du die Items zu Skalen zusammenfassen. Z. B., indem Du den Mittelwert der entsprechenden Items berechnest. Davor empfiehlt es sich, zu testen, ob bzw. wie gut die Items zusammenpassen: mit Korrelationen und am besten auch Reliabilitätsanalysen. Evtl. musst Du Items umpolen, falls sie inhaltlich in entgegengesetzte Richtungen weisen. (z. B. Zufriedenheit mit x von 1 bis 5 (5 = sehr zufrieden) vs. Unzufriedenheit mit y von 1 bis 5 (5 = sehr unzufrieden).
      Dann die Moderatorvariable (Skala) mit der unabhängigen Variable (Skala) multiplizieren und diese neue Variable als Moderatorterm ins Modell mit aufnehmen.

  17. Hallo Herr Riepl,
    Vielen Dank für die Erklärung.
    Ich habe bei meiner Bachelorarbeit die Interaktionen einmal mit den standardisierten Werten gemacht und einmal ohne, diese Interaktionen sehen aber teilweise nicht ähnlich aus. Kann das sein oder müsste der Moderatoreffekt (also die beiden Linien) ungefähr gleich aussehen?
    Außerdem kreuzen die Linien sich jetzt über der X-Achse da sie ja standardisiert sind, das sieht zwar nicht schön aus, ist aber nicht zu ändern oder? Die X-Achse sollte schon bei null bleiben denke ich?
    Vielen Dank im Voraus und Viele Grüße
    Viki

    1. Hallo Viki,
      ja, es ist normal, dass Interaktionen mit standardisierten Werten ein wenig anders aussehen. Immerhin werden dabei ja Effekte unterschiedlich großer Skalen ausgeglichen.
      Ich denke es ist nicht störend, wo die Linien sich kreuzen. Wichtig wäre mir vor allem zu zeigen, dass die Linien nicht parallel verlaufen – das ist das wesentliche Kennzeichen des Interaktionseffekts.
      Viele Grüße,
      Wolf

  18. Lieber Herr Riepl,

    vielen Dank für die tolle und anschauliche Erklärung! Ich hätte mal eine Frage zur Moderation innerhalb von Varianzanalysen: Ich möchte eine Moderation rechnen, allerdings ist mein Moderator metrisch. Muss ich diesen Moderator dummy-codieren, um ihn in die Varianzanalyse einfließen zu lassen oder gibt es da auch einen anderen Weg (da die Variable 5 stufig ist, wird die Interpretation des Moderators als Dummy nämlich bestimmt alles andere als einfach).

    Besten Dank und viele Grüße
    Anna

    1. Hallo Anna,
      die Herausforderung liegt nicht im Moderator, sondern in der fünfstufigen Variable. Vorschlag: Regression, vier Dummyvariablen für vier Faktorstufen, die fünfte Stufe kommt nicht ins Modell und dient als Referenzkategorie. Jede der vier Stufen kannst Du mit dem metrischen Moderator multiplizieren, um die Interaktionsterme zu erhalten.
      Mehrere Interaktionsterme in einem Modell sind allerdings sehr schwer zu interpretieren. Ich würde separate Modelle mit jeweils nur einem Moderator verwenden. Interpretation eines signifikanten Moderatorterms: Der Effekt der Stufe x im Vergleich zur Referenzkategorie fällt unterschiedlich aus je nach Ausprägung des Moderators.

      1. Hallo Herr Riepl,
        haben Sie tausend Dank für Ihre schnelle und ausführliche Antwort! Entschuldigung, ich hab mich falsch ausgedrückt! Nicht die Variable ist fünfstufig, sondern der Moderator. Meine unabhängige Variable in der Varianzanalyse ist dichotom (zwei Gruppen) und die unabhängige Variable ist metrisch. Der MODERATOR ist fünfstufig (entschuldigen Sie, da hab ich mich wirklich falsch ausgedrückt)! Ich würde also gerne einen Interaktionseffekt aus meiner unabhängigen Variable (dichotom) und dem Moderator (fünfstufig) berechnen – da wäre also die Frage, ob ich den Moderator einfach dummy-codieren (vier Dummyvariablen, eine Referenzkategorie) kann und dann mit ins Modell einfließen lasse?!
        Vielen Dank und Entschuldigung für die missverständliche Beschreibung
        Anna

        1. Hallo Anna,
          ich denke, in dem Fall ist es ähnlich. Ja, dummy-codieren. Ein Modell mit mehreren Interaktionstermen ist auch so schwer zu interpretieren. Stehen die fünf Stufen für eine bestimmte Reihenfolge? Dann könnte man überlegen, bei einer bestimmten Schwelle (Verteilungen beachten, sodass ausreichende Gruppengrößen entstehen; es muss natürlich auch inhaltlich sinnvoll sein) in hoch und niedrig zu unterscheiden. Wenn allel fünf Stufen wichtig sind, würde ich es mit separaten Modellen versuchen.

          1. Das ist eine super Idee! Die fünf Stufen stehen für „stimme überhaupt nicht zu“ bis „stimme voll und ganz zu“! Eine Unterteilung in zwei Stufen könnte ich auf jeden Fall mal ausprobieren! Haben Sie vielen Dank für die Antwort! Ansonsten sind die separaten Modelle wohl wirklich die beste Lösung!
            Beste Grüße und vielen Dank noch mal
            Anna

          2. Hallo Herr Riepl,

            entschuldigen Sie, ich noch mal 😉 Ich habe eine ganz kurze Nachfrage, da ich gerade versuche, Ihren Vorschlag, meine fünfstufige Variable in eine zweistufige Variable umzuformen, umsetzen möchte.
            Dabei ist mir aufgefallen, dass ich nicht nur die Stufen „stimmt nicht zu“ und „stimmt zu“ umcodieren kann, sondern die Ausprägung „3“ noch bedenken muss, die ja „unentschieden“ bedeutet und sich somit weder zur 1 „stimme nicht zu“ noch zur 2 „stimme zu“ zuordnen lässt. Wenn ich nun meine fünfstufige Variable in eine dreistufige Variable, 1 „stimme nicht zu“, 2 „mittel“ und 3 „stimme zu“ umforme, darf ich dann diese Variable noch als Moderator in das Set der unabhängigen Variable in meine Varianzanalyse nehmen? Oder kann ich dann eine Dummy-Codierung dieses dreistufigen Moderators nicht umgehen?

            Haben Sie besten Dank für Ihre Hilfe
            Anna

          3. Ich würde mir die Verteilungen ansehen und dann zwei Gruppen bilden. Z. B. „Stimme zu“ vs. „Unentschieden / stimme nicht zu“.

  19. Hallo Herr Riepl,
    Ich habe eine Frage zur z-Standardisierung eines dichotomen Moderators. Ich habe bereits einiges zur z-Standardisierung gelesen und bin mir jetzt nicht sicher, ob das in meinem Fall sinnvoll wäre oder nicht.
    Konrekt: mein Prädiktor ist Gewissenhaftigkeit (kontinuierlich), mein potentieller Moderator ist Arbeitslosigkeit (dichotom) und das Kriterium ist Lebenszufriedenheit (kontinuierlich). In meiner Statistik Vorlesung habe ich gelernt, dass man Prädiktor und Moderator am besten z-standardisiert. Wie ich in einem Buch (Hayes : Introduction to Mediation, Moderation and Conditional Process Analysis) gelesen habe, ändert eine z-Standardisierung nichts am Ergebnis für den Interaktionsterm, sondern es geht dabei vielmehr um die Interpretierbarkeit der Moderation. Jetzt habe ich Bedenken, dass eine z-Standardisierung von Arbeitslosigkeit dazu führt, dass ich das ganze weniger gut interpretieren kann, daher würde ich eher nicht standardisieren.
    Wie ist Ihre Meinung denn dazu?
    Liebe Grüße,
    Christine

    1. Hallo Christine,
      bei dichotomen Merkmalen halte ich eine z-Standardisierung nicht für sinnvoll.
      Viele Grüße & viel Erfolg!
      Wolf Riepl

  20. Hallo, ich hoffe hier ist noch wer aktiv…
    ich untersuche zZ den Zusammenhang von versch. Lerngelegenheiten(UV) mit dem daraus folgenden Wissenscore (AV, intervallskaliert). Dabei werden Kontrollmerkmale eingebracht (Berufswunsch ja/nein; absolvierte Ausbildung ja/nein; Intelligenz intervallskaliert). Ein positiver Einfluss von Anzahl der Lerngelegenheiten auf Wissen wird erwartet. Nun könnte ich doch einfach eine Regression berechnen und die 3 Merkmale zur Kontrolle mit einbringen.
    Hintergrund: Ich benötige min. 3 Hypothesen (max 5). Da ich nur 2 versch Lerngelegenheiten a und b habe kann ich ja nur 2 Hypothesen aufstellen.
    Var1 (nicht ausreichend)
    H1 Anzahl LGa wirkt positiv auf Wissen
    H2 Anzahl LG2 wirkt positiv auf Wissen
    jeweils unter Hinzunahme der 3 Kontrollvariablen.

    Nun bekam ich den Tip das mit Mediatoreffekten zu machen, weil ich so mehr Hypothesen aufstellen könne(?).
    Aktuelle Studien konnten zeigen dass Intelligenz in diesem Fall nicht so sehr wirkt, so könnt ich das begründet weg lassen.
    Außerdem hat die Ausbildung wohl den größten Effekt weshalb ich bei LGb auch nur diese mit einbeziehen würde.

    Var2 (machbar?)
    H1.1 Anzahl LGa wirkt positiv auf Wissen (normale Regression)
    H1.2 Anzahl LGa*Berufswunsch wirkt positiv auf Wissen (Moderatoreffekt)
    H1.3 Anzahl LGa*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    H2.1 Anzahl LGb wirkt positiv auf Wissen (normale Regression)
    H2.2 Anzahl LGb*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    Das ganze auf 30 Seiten Bachelorarbeit.
    Wie seht ihr das?

    1. Hallo Dirk,

      meinst Du Moderator- oder Mediator-Effekt? Das sind unterschiedliche Modelle und unterschiedliche Hypothesen. Oben steht Mediator, unten Moderator. Die Hypothesen passen zu Moderator-Effekten.
      Ja, hört sich gut an.

      Formulierungsvorschlag:
      Anzahl LG (gilt für a und/oder b) wirkt unterschiedlich auf Wissen je nach Ausbildung bzw. Berufswunsch.

      Viel Erfolg!

      Wolf

  21. Lieber Wolf,

    besten Dank für die einfache und gut erklärte Darstellung der Moderationseffekte! Ich hatte in der Tat anfangs gar keinen Plan gehabt, wie ich die Interaktionen richtig interpretieren soll! Toll gemacht!

    LG aus NRW,

    Tati

  22. Hallo Wolf,

    danke für dein aufschlussreiches Video. Ich hätte eine Frage zu einem Untersuchungsdesign, das etwas komplizierter ist.

    Ich habe zwei intervallskalierte UV (zB: Intelligenz und Arroganz) und eine Gruppenvariable mit Gruppen (zB. Unter-, Mittel- und Oberschicht). Meine AV wäre intervallskaliert (zB. Anzahl Fotos Instagram).

    Erhalte ich nun einen, zwei oder drei Interaktionsterme und wie interpretiere ich das Ergebnis?

    Vielen Danke für deine Hilfe.

    Patrick

    1. Hallo Patrick,
      das ist in der Tat kompliziert. Hast Du denn Hypothesen zu allen Interaktionen? Ich würde mir die Interaktionen einzeln anschauen, d. h. ein Interaktionsterm pro Modell (sowie die Haupteffekte, d. h. die UVs, die die Interaktion bilden, auch einzeln in das Modell aufnehmen). Wenn Du die Gruppenvariable nicht sehr grob als (quasi-)metrisch auffassen willst, musst Du mit Dummyvariablen arbeiten, d. h. 0/1-Codierung. Ich würde dann eine Gruppe mit allen anderen vergleichen. Z. B. Gruppenvariable Unterschicht, 1=Unterschicht, 0=keine Unterschicht. Gibt es eine Interaktion, dann unterscheidet sich die Steigung der Regressionsgeraden zwischen Unterschicht und „Nicht-Unterschicht“.
      Ich weiß nicht, ob sich ein Gesamtmodell mit mehreren Interaktionstermen sinnvoll interpretieren lässt. Für jeden Term müsste gelten „wenn alle anderen Modellvariablen konstant gehalten werden“.
      Also generell: So einfach wie möglich, so komplex wie nötig. Ich bezweifle, dass es „nötig“ ist, alle Interaktionen in ein Modell zu werfen und dann exakt zu interpretieren …
      Viel Erfolg!

      1. Vielen Dank für die schnelle Antwort. Ich möchte ein großes Modell haben und habe insgesamt 4 Prädiktoren und zwei Interaktionsterme, die unter Berücksichtigung der Literatur sinnvoll wären. Die Prädiktoren und Interaktionsterme würde ich dann gerne hierarchisch aufnehmen.
        Ich glaube, dass ich mir noch mal den Bühner/Ziegler vornehme und mit meinem Prof. berate.
        Danke für die Erklärung.

  23. Hallo,

    ich habe ähnlich wie Deleno einen metrischen Moderator, während der andere UV kategorial ist. AV ist metrisch. Ich habe vor der Analyse metrischen Variablen standardisiert, die kategoriale Variable (3 Stufen) dummycodiert. Ich habe auch die Grafik erstellt, die jedoch gleich ist mit deiner – bei dir fungiert jedoch der kategoriale Prädiktor als Moderator. Ist es falsch, wenn ich gleiche Grafik verwende und sage, dass die metrische Variable der Moderator ist, wobei der auf der x-Achse abgebildet ist?

    Tausend Dank im Voraus!

    Lena

    1. Hallo Lena,
      klingt erst mal vernünftig. Kannst Du das Ergebnis interpretieren, sodass es inhaltlich sinnvoll ist und zur Grafik passt? Dann denke ich passt es.

  24. Hallo,

    vielen Dank für die gute Erklärung!!! Kann es eigentlich Probleme geben, wenn ich einen dichotomen Moderator (0 und 1) habe, wo die Stichprobengröße verschieden ist? Also wenn N = 600 für Ausprägung 0 und N = 2000 für Ausprägung 1 betragen. Oder wird das durch Gewichtung und Z-Standardisierung (der UV, nicht der Dummyvariable) ausgeglichen?

    Lieben Gruß
    Joleena

    1. Hallo Joleena,
      ich verstehe es so: Die Stichprobengröße ist N=(2000+600)=2.600.
      Bei einem dichotomen Merkmal wird man nur in seltenen Fällen eine genaue Gleichverteilung der beiden Ausprägungen erreichen. Prinzipiell und in Deinem Beispiel halte ich das für völlig unproblematisch. Schwierig wird es nur, wenn eine Ausprägung sehr schwach besetzt ist. Z. B. 10 mal die 0 und 2590 mal die 1. Dann wären die Ergebnisse nicht besonders belastbar. Aber bei 600 / 2000 sehe ich da kein Problem.

      Ungleiche Gruppengrößen kann man natürlich durch Gewichtung ausgleichen. Das könnte sinnvoll sein, wenn „in Wirklichkeit“ (in der Grundgesamtheit) die Verteilung des dichotomen Merkmals ausgeglichen ist (50/50). Das muss nicht so sein.

      z-Standardisierung passt hier meines Erachtens nicht. Die ist sinnvoll, wenn man verschiedene Merkmale hat, die auf unterschiedlichen Skalen gemessen wurden, z. B. Alter in Jahren, Länge in Zentimetern usw. Dann hat „eine Einheit“ je nach Merkmal eine ganz unterschiedliche Bedeutung. Ohne Standardisierung können Merkmale mit „großen“ Skalen einen größeren Einfluss auf die Ergebnisse ausüben als Merkmale mit „kleinen“ Skalen.

  25. Hallo,

    kurz eine Frage zum Interaktionseffekt:
    Im Interaktionsterm in der Regression wird nur die Gruppe analysiert, die als UV mit dem Wert 1 kodiert ist oder?
    Also wenn z.B.
    UV=Migration –> 0=kein Migrationshintergrund und 1=Migrationshintergrund
    Moderator= Einkommen (metrisch: hohe Werte= hohes Einkommen)

    Dann wäre die Interpretation des Interaktionseffektes: je reicher ein Migrant desto…

    Kann man irgendwie auch untersuchen, wie sich hohes Einkommen bei Personen ohne Migrationshintergrund auswirken würde?

    Vielen Dank

    1. Hallo Deleno,
      es geht um eine Wechselwirkung. Also nicht: Je reicher, desto, … Sondern: Bei höherem Einkommen wirkt der Migrationshintergrund anders auf die AV als bei niedrigem Einkommen.

      Vielleicht fällt die Interpretation leichter, wenn Du den Migrationshintergrund als Moderator betrachtest? Formulierungsvorschlag: Mit Migrationshintergrund wirkt das Einkommen anders auf die AV als ohne Migrationshintergrund.

      1. Hmm..aber könnte der Interaktionseffekt dann nicht so interpretiert werden:
        Je höher das Einkomen, desto zufriedener sind Migranten? (wenn Einkommen einen positiven Effekt hat)

        1. Versuch es mal einfach:
          Wie ist die Korrelation zwischen Einkommen und Zufriedenheit (das ist wohl die AV) insgesamt?
          Und dann getrennt für Migranten und Nicht-Migranten: Wie ist da jeweils einzeln die Korrelation zwischen Einkommen und Zufriedenheit? Unterscheiden sich die Korrelationskoeffizienten?

  26. Hallo,

    danke erstmal für die gute Erklärung!
    Ich habe eine Frage zu dem Video. Wie würde nun die Regressionsgleichung für das Modell mit dem Interaktionseffekt (03:50 Minuten) aussehen, wenn ich den Lernerfolg voraussagen möchte?
    Bleibt der Term Lernstunden in dem Regressionsmodell, obwohl es nicht signifikant (0.199) ist oder wird der Term entfernt und das Modell erneut berechnet?

    Vielen Dank

    1. Hallo Philipp,
      ich würde die Lernstunden drinlassen. Das Besondere an den Interaktionseffekten ist ja, dass der Effekt der Lernstunden nicht mehr nur in dem Prädiktor Lernstunden steckt, sondern auch zum Teil in dem Interaktionsterm Lernstunden * Entspannungstechnik, der signifikant ist. D. h. diese beiden Terme sind nicht von einander unabhängig; beide „gehören“ zum Modell.
      Viel Erfolg mit Deinen Analysen!
      Wolf

Schreibe eine Antwort zu Patrick Antwort abbrechen