Moderatoreffekte interpretieren und grafisch darstellen

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie abgeleitet, was UV und was Moderator ist) und das Produkt (die Multiplikation) der beiden als sogenannten Interaktionsterm ins Regressionsmodell auf. Erweist sich der Interaktionsterm als signifikant, so liegt ein Moderatoreffekt vor; auf deutsch: die unabhängige Variable wirkt unterschiedlich auf die abhängige Variable ein, je nach Zustand des Moderators.

Update: Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video:
Regressionsmodelle visualisieren in R (ggplot2, plotly)

Moderatoreffekte im Video

Die Herausforderung: genaue Interpretation des Moderatoreffektes

So weit, so gut. Die Schwierigkeiten beginnen oft damit, die Vorzeichen und Wirkungsrichtungen zu interpretieren. Der Effekt der unabhängigen Variablen ist nun nicht mehr allein an ihrem Koeffizienten abzulesen, sondern zusätzlich auch im Interaktionsterm enthalten. Was bedeuten die Ergebnisse nun genau?

Hier helfen grafische Darstellungen. Zunächst ein einfaches, konstruiertes Beispiel (ist nicht von mir, ich bin in einem Statistikforum darauf gestoßen). Nicht zur praktischen Nachahmung empfohlen!

Moderatoreffekt: nur mit Moderator übt die UV einen Effekt auf die AV aus
Moderatoreffekt: Feuerzeug, Benzin, Hautverbrennung; eigene Darstellung

Hier wird die Wirkungsweise eines Moderators hoffentlich noch deutlicher. Schüttet sich jemand Benzin (=unabhängige Variable, UV) auf den Arm, so resultiert daraus noch keine Hautverbrennung (=abhängige Variable, AV). Hält er sich jedoch zusätzlich ein Feuerzeug (Moderator) an den Arm, dann – Kawumm. Je nachdem, ob ein Feuerzeug verwendet wird oder nicht, bewirkt das Benzin einen sehr unterschiedlichen Effekt auf die Haut. (Das Feuerzeug allein wird zu einer gewissen Hautverbrennung führen, aber bei weitem nicht so schlimm wie mit Benzin. Man kann die beiden Effekte nicht getrennt von einander betrachten oder einfach addieren.)

Die Grafik zeigt, dass Benzin ohne Feuerzeug praktisch keinen Einfluss hat, mit Feuerzeug dagegen ein sehr starken.

Beispiel 1: Der Moderator verstärkt eine positive Beziehung

Nun gibt es verschiedene Möglichkeiten, wie Moderatoreffekte wirken können. Ein weiteres Beispiel:

Moderatoreffekt: Lernerfolg, Lernstunden, Entspannungstechnik

Abhängige Variable ist der Lernerfolg; UV: Lernstunden; der Einsatz einer Entspannungstechnik wirkt als Moderator. Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht: die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus. Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik beeinflusst. Mit anderen Worten: Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.

Beispiel 2: Der Moderator schwächt eine positive Beziehung ab

Hier geht es wieder um den Zusammenhang zwischen Lernstunden und Lernerfolg, Moderator ist diesmal jedoch der Alkoholkonsum.

Moderatoreffekt: Der Moderator schwächt eine positive Beziehung ab

Diesmal schwächt der Moderator die positive Beziehung ab. Auch hier gilt: der Lernerfolg steigt mit steigender Anzahl der Lernstunden. Mit höherem Alkoholkonsum wird der Zusammenhang jedoch schwächer.

Beispiel 3: Der Moderator verstärkt einen negativen Zusammenhang

Im letzten Beispiel wird ein negativer Effekt nachgewiesen, der durch einen Moderator sogar noch verstärkt wird.

Moderatoreffekt: Ausdauer, Übergewicht, Rauchen

Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.

Übrigens: Findet man keinen Moderatoreffekt, so bedeutet das grafisch, dass die beiden Geraden parallel verlaufen. Alle Beispiele sind konstruiert und beruhen nicht auf realen Daten!

Zuletzt natürlich die Preisfrage: Wie macht man das? Am besten in R.

Es gibt praktische Excelvorlagen dazu, in die man nur die Modellkoeffizienten eintragen muss. Sogar die Interpretation ist vorbereitet, allerdings auf Englisch.

Fundstelle: StatWiki, Case Western Reserve University, Cleveland, Ohio [URL leider nicht mehr erreichbar]
Excel-Tool, two-way interactions
Weitere Informationen bei Jeremy Dawson.

Bei der Verwendung der Tools von Jeremy Dawson wird zwischen standardisierten und unstandardisierten Variablen unterschieden; StatWiki setzt standardisierte Variablen voraus (als ich das Tool heruntergeladen habe, stand dort der Hinweis „unstandardisiert“ – meines Erachtens ist das falsch!). Manche Autoren empfehlen Standardisierung (vor Berechnung des Interaktionsterms). Dadurch wird der Einfluss unterschiedlicher Skalierungen der Variablen neutralisiert. Ein typisches Beispiel bilden Geschlecht (zwei Ausprägungen) und Alter (z. B. von 18 bis 65). Nachteil der Standardisierung ist schwierigere Interpretierbarkeit: was bedeutet eine Einheit einer standardisierten Variable?

In beiden Fällen sind die unstandardisierten Regressionskoeffizienten (B, nicht beta) einzutragen. Bei unstandardisierten Variablen müssen zusätzlich Mittelwert und Standardabweichung eingetragen werden; bei z-standardisierten Variablen ist dies nicht notwendig, da der Mittelwert 0 beträgt und die Standardabweichung 1.

Viel Erfolg beim Interpretieren von Moderatoreffekten! Welche Erfahrungen haben Sie damit gemacht? Wenn Ihnen der Artikel weitergeholfen hat – bitte weitersagen!

Literaturtipps:

Introduction to Mediation, Moderation, and Conditional Process Analysis, Second Edition: A Regression-Based Approach (Methodology in the Social Sciences)
Discovering Statistics Using IBM SPSS
Discovering Statistics Using R

130 Gedanken zu „Moderatoreffekte interpretieren und grafisch darstellen“

  1. Lieber Herr Riepl,

    vielen Dank für die gut erklärte Darstellung der Moderation! Ich habe eine Frage zu Beispiel 2 „Der Moderator schwächt eine positive Beziehung ab“. Wie sehen hierfür die Null- und Alternativhypothese aus?

    Konkret habe ich folgende Variablen:
    – metrische unabhängige Variable
    – kategorialer Moderator mit zwei Ausprägungen (0=Kontrollgruppe, 1=Experimentalgruppe)
    – metrische abhängige Variable

    Meine Vermutung ist, dass die UV und AV positiv zusammenhängen. Wenn die Versuchspersonen jedoch der Experimentalgruppe (1) angehören, dann verringert sich dieser Zusammenhang.

    Die Hypothesen für die Interaktion hätte ich deshalb so formuliert:
    – H0: ß größer/gleich 0
    – H1: ß 0 heißen?

    Herzlichen Dank für Ihre Hilfe!

    1. Hallo Lea,
      mein Vorschlag für die Hypothesen:
      H0 = Nullhypothese bedeutet: Kein Effekt. Wenn es speziell um den Moderator geht, würde ich formulieren:
      Der Moderator hat keinen Effekt auf den Zusammenhang zwischen UV und AV. = Es gibt keinen Moderator-Effekt (Der Moderatoreffekt ist nicht sig.). = Der Zusammenhang zwischen UV und AV unterscheidet sich nicht sig. zwischen Kontrollgruppe und Experimentalgruppe.
      H1 = Alternativhypothese: Es gibt einen Effekt, hier: einen signifikanten Moderatoreffekt. Die Gruppenzugehörigkeit wirkt sich signifikant auf den Zusammenhang zwischen UV und AV aus.

      Was das „Abschwächen“ betrifft, würde ich das aus der Grafik ablesen. Anhand der Vorzeichen ist es auch möglich, aber das finde ich schwierig, da es einige Kombinationsmöglichkeiten gibt.

      1. Lieber Herr Riepl,

        vielen Dank für Ihre Antwort!! Das hat mir sehr weitergeholfen, dann werde ich es so machen.

        Ich habe noch eine weitere Frage zur Zentrierung der Variablen. Dazu gibt es ja, wie mir scheint, sehr widersprüchliche Meinungen. Ich rechne die Moderatoranalyse mittels Process und kriege dann die Effekte für meinen Faktor A, Faktor B und für die Interaktion. Ich möchte allerdings nicht nur dei Interaktion interpretieren, sondern auch die Haupteffekte. Angenommen, ich zentriere meine kontinuierliche Variable (Faktor B) und lasse meine kategoriale Variable (Faktor A, gleichzeitig Moderator) so wie sie ist. Kann ich dann die Haupteffekte inteprreiteren? Also z. B. sagen:
        – Haupteffekt Faktor A: bei einer durchschnittlichen Ausprägung von Faktor B (weil zentriert) gibt es für Faktor A einen signifikanten Effekt
        – Haupteffekt Faktor B: wenn Faktor A konstant gehalten wird, gibt es für Faktor B einen signifikanten Effekt

        Oder muss ich das anders formulieren bzw. bzgl. der Zentrierung anders vorgehen? Ich hoffe, es ist verständlich, wie ich es meine.

        Nochmal ganz herzlichen Dank!!

  2. Hallo Her Riepl,

    ich schreibe gerade eine Seminararbeit zum Thema Moderation in PROCESS. Eine Frage die ich mir hier stelle. Nachdem wir unseren Datensatz bearbeitet haben und überprüft haben, lassen wir die PROCESS Analyse laufen. Bei dieser Analyse kommt raus das der Interaktionseffekt mit p=.2525 nicht signifikant ist. Des Weiteren ist der Interaktionseffekt mit .0374 sehr gering. In der graphischen Analyse erkennt man eine leicht höhere Steigung der untersten Gerade, sodass die 3 Gerade leicht zusammenlaufen? Kann man dies als Moderationseffekt analysieren, oder sollte man da lieber die Aussage tätigen, dass es keinen erkennbaren Moderationseffekt gibt? Gibt es dazu Quellen? Mit den besten Grüßen

    1. Dass die Geraden perfekt parallel verlaufen und sich somit auch bei großem Wertebereich nicht schneiden, ist eine sehr strenge Forderung, die bei realen Daten kaum zu erfüllen ist. Der statistische Test (p-Wert des Interaktionseffekts) sagt deutlich aus, dass die (sehr schwache) Wechselwirkung nicht signifikant ist. Die Daten können also aus einer Grundgesamtheit stammen, in der es überhaupt keine Wechselwirkung gibt; die schwache Abweichung von der „perfekten“ Parallelität der Geraden ist statistisch nicht von zufälligen Schwankungen zu unterscheiden.

  3. Hallo Wolf,

    großes Lob für deine Seite – hat mir bei der Auswertung meiner Masterthesis bereits sehr geholfen.

    Leider stehe ich bei einer Moderation gerade auf dem Schlauch.
    Folgendes Szenario:
    Meine UV Technikbereitschaft hat einen negativen Einfluss auf den Technostress.
    Mein Moderator Organisationale Faktoren hat ebenfalls negativen Einfluss auf den Technostress.
    Der Interaktionstermin ist jedoch nicht signifikant.

    Bis dahin ist noch alles in Ordnung.
    Nun habe ich aber festgestellt, dass die organisationalen Faktoren einen positiven Effekt auf die Technikbereitschaft haben und ich frage mich, wie ich dies – gerade aufgrund des nicht signifikanten Interaktionsterms – interpretieren soll.

    Freu mich über deine Anmerkungen.

    Viele Grüße
    Antje

    1. Hallo Antje,
      die nicht sig. Interaktion würde ich so interpretieren: Der Einfluss der Technikbereitschaft auf den Technostress ändert sich nicht wesentlich, wenn sich die Organisationalen Faktoren verändern. Anders formuliert: Der Einfluss der Technikbereitschaft auf den Technostress ist von der Ausprägung der Organisationalen Faktoren unabhängig.
      Zum weiteren Verständnis der Zusammenhänge empfehle ich folgende Modelle zu vergleichen. AV ist immer Technostress.

      1. UV nur Technikbereitschaft
      2. UV nur Organisationale Faktoren
      3. UVs Technikbereitschaft und Organisationale Faktoren (ohne Interaktionsterm)

      Wie verändert sich der Koeffizient einer UV, wenn die andere UV hinzugenommen bzw. ausgeschlossen wird? Die Koeffizienten sollten sich spürbar ändern, da TB und OF zusammenhängen.
      Formulierungshilfe zur Interpretation: Unter Kontrolle der OF ändert sich der Einfluss der TB … Bzw. Unter Kontrolle der TB ändert sich der Einfluss der OF …

      Denkmodell: Es geht nicht um „das eine richtige Modell“, sondern der Modellvergleich liefert zusätzliche Informationen für die Interpretation, d. h. mehrere Modelle sind hilfreich, um Zusammenhänge zwischen Variablen besser zu verstehen.

      Viel Erfolg

      1. Hallo Wolf,

        vielen Dank für deine Rückmeldung.

        Bei Modell 1 ist der Regressionskoeffizient B -.34, p <.001
        Bei Modell 2 ist der Regressionskoeffizient B -.24, p .<001
        Bei Modell 3 ist der Regressionskoeffizient bei Technikbereitschaft: -.29, p.<001 und bei den Organisationalen Faktoren: -.17, p <.001

        D.h. Unter Kontrolle der OF verringert sich der Einfluss der TB? Bzw. unter Kontrolle der TB ändert sich der Einfluss von OF? Wie kann man dies begründen?

        Wenn TB die persönliche Einstellung von Menschen gegenüber modernen Technologien operationailisert und die organisationalen Faktoren die bestehenden Settings (wie der technische Support durch Helpdesks oder die Einbindung von Mitarbeitern bei technischen Neuerungen) – wie macht das Ergebnis dann inhaltlich Sinn?
        Etwa so?: Dass ich, auch wenn ich weniger Technikbereitschaft aufweise, durch den Einfluss von organisationalen Faktoren weniger Technostress wahrnehmen kann? Oder interpretiere ich das Ergebnis falsch? Bin mir noch unschlüssig, was ich aus den Ergebnissen der 3 Modelle ziehen kann.

        Liebe Grüße
        Antje

        1. > D.h. Unter Kontrolle der OF verringert sich der Einfluss der TB? Bzw. unter Kontrolle der TB ändert sich der Einfluss von OF?
          Ja. OF und TB korrelieren, dadurch sind ihre Effekte im gemeinsamen Modell etwas schwächer als jeweils einzeln. (Bildlich gesprochen: Die Effekte überschneiden sich etwas.)
          Da in Modell 3 beide Effekte sig. bleiben, gilt weiterhin: Sowohl TB als auch OF reduzieren den Technostress.

          > Dass ich, auch wenn ich weniger Technikbereitschaft aufweise, durch den Einfluss von organisationalen Faktoren weniger Technostress wahrnehmen kann?
          Ich würde es so formulieren:
          Unter Konstanthaltung der OF reduziert TB den Technostress.
          Analog: Unter Konstanthaltung der TB reduziert OF den Technostress.

          Auch wenn sich die TB der Mitarbeiter nicht verändert, hilft eine Verbesserung der OF gegen Technostress.
          Analog: Wenn die OF gleich bleiben, aber die Mitarbeiter (z. B. durch eine coole Weiterbildung) zu einer höheren TB kommen, reduziert sich der Technostress.

  4. Hallo Herr Riepl,

    eine kleine Frage:
    Ich habe hier in einer Arbeit bei einer hierarchischen Regression eine signifikante Interaktion von Moderator und UV auf AV erhalten. Jedoch war das Ergebnis zuvor nicht signifikant, heisst UV und AV hingen laut meinen Ergebnissen nicht signifikant zusammen. Wenn ich einen Moderationsplot erstelle, wird bei niedrigem Moderator ein leicht negativer Zusammenhang (Gerade ist annähernd flach) der UV und AV ersichtlich. Bei hohem Moderator zeigt sich dann ein recht deutlicher positiver Zusammenhang der UV und AV.
    Wie ist dies zu interpretieren, nachdem der negative Zusammenhang bei niedrigem Moderator ja eigentlich nicht signifikant wäre?
    Muss ich beim Berichten schreiben, dass es bei niedrigem Moderator einen negativen Zusammenhang gab und bei hohem Moderator einen positiven oder gibt es noch etwas anderes zu beachten? (Hypothese 1 war: UV hängt positiv mit AV zusammen – abgelehnt -, Hypothese 2 war: Moderator schwächt positiven Zusammenhang zwischen UV und AV ab).

    Vielen Dank
    Céline

    1. Hallo Céline,
      haben Sie auch ein Modell mit UV und Moderator-Variable einzeln, d. h. ohne Moderator-Effekt (Interaktionsterm)? Es könnte auch sein, dass der Moderator den Zusammenhang zwischen UV und AV verdeckt. Verdeckte Korrelation ist das Gegenstück zur Scheinkorrelation.
      H2 ist meines Erachtens anhand der Ergebnisse abzulehnen. Vorschlag: Es besteht ein Interaktionseffekt (Empfehlung: Sig.test in Modell mit Interaktionsterm), d. h. die Ausprägung der Moderatorvariable beeinflusst den Zusammenhang zwischen UV und AV. Nur bei hoher Ausprägung des Moderators besteht ein sig. positiver Zusammenhang; bei geringer Ausprägung kein Zusammenhang (tendenziell leicht negativ, aber nicht sig.).

      1. Vielen Dank für die Antwort.
        Im Modell wurde nach den Kontrollvariablen in einem Schritt die UV hinzugezogen, im nächsten Schritt der Moderator (beides nicht signifikant) und dann wurde die Interaktion ermittelt (signifikant).
        H2 wird auf jeden Fall abgelehnt, da die Interaktion in die entgegengesetzte Richtung geht als erwartet. Probleme macht es mir jedoch, dass H2 auf die Annahme von H1 beruhen. Ich müsste berichten, dass die Gerade bei hohem Moderator sich in die entgegengesetzte Richtung gewendet hat (im Vergleich zu niedrigem MOD von negativ zu positiv). Jedoch macht es für mich nicht so viel Sinn dies zu schreiben, wenn der negative Zusammenhang bei niedrigem MOD keine Signifikanz aufweist.
        Dies ist meine erste Arbeit, deswegen bin ich sehr verunsichert. Vielleicht berichtet man dies auch so und ich weiss es noch nicht besser, oder aber ich interpretiere die Ergebnisse falsch (bzgl. keine Signifikanz bei niedrigem MOD).

        1. Ich würde das entspannt sehen und möglichst genau die Befunde beschreiben. Es ist ja nicht schlimm, wenn Hypothesen abgelehnt werden: das ist ein völlig legitimes Ergebnis, das Erkenntnisse liefert.
          Hinweis: Es gilt als nicht wissenschaftlich, wenn man Hypothesen erst NACH Blick auf die Daten erstellt und dann an denselben Daten testet. Somit könnte man hier vorschlagen / diskutieren, H2 anders zu formulieren. Das müsste dann an NEUEN Daten überprüft werden. Das ist ein übliches Vorgehen, etwa unter dem Stichpunkt „Ausblick auf weitere Forschung“. (Diese Überprüfung müssen Sie natürlich nicht gleich selbst machen, Vorschlagen genügt erst mal …)

          1. Ja, so habe ich das bereits gemacht. Es gab nur noch einmal eine Änderung in den Daten und somit in der Anschauung des Plots. Deswegen war ich mit der Interpretation verunsichert. Wenn Sie mir jedoch mit meiner Erklärung zustimmen, bin ich beruhigt 😀 Vielen Dank für die Hilfe! Freundliche Grüsse

  5. Sehr geehrter Herr Riepl,

    vielen Dank für die Seite! Ich habe zwei Fragen zu meiner Analyse:

    Meine Moderationsanalyse hat 1 Kriterium und 3 Prädiktoren (2 metrisch und 1 dichotom). Nun wollte ich ursprünglich auch 2 Interaktionen jeweils zwischen dem dichotomen Prädiktor und den beiden anderen in einem Modell rechnen, habe aber in den vorherigen Kommentaren gelesen, dass das nicht empfehlenswert ist. Wenn ich das nun getrennt rechne, geht das mit AV = UV1 + UV2 + UV1*MOD und AV = UV1 + UV2 + UV2*MOD oder muss ich die UV, die nicht im Interaktionsterm enthalten ist, rausgeben und was ist der Unterschied dabei?

    Wie ist das zu verstehen, wenn ein Prädiktor zuvor in der Multiplen Regression signifkant war (Moderator nicht signifkant) und durch das Hinzufügen des Interaktionsterms nicht signifikant wird, der Moderator und die Moderation aber auch nicht signifikant sind?

    Vielen Dank im Voraus!

    LG, Min

    1. Hallo Min,

      a) Die UV, die nicht im Interaktionsterm enthalten ist, kann im Modell bleiben. Der Unterschied ist, ob nach dieser Variable „kontrolliert“ wird oder nicht. Das kann schon sinnvoll sein.

      b) Effektveränderung durch Hinzufügen eines Interaktionsterms: Eine Interpretation ist, dass es eine schwache Interaktion gibt: zu schwach, um signifikant zu werden, aber stark genug, um einen Teil des Effekts des Prädiktors „aufzusaugen“, sodass dieser auch nicht mehr signifikant ist.

      Generell finde ich es hilfreich, diese Modelle als Werkzeuge zu sehen, mit denen man Informationen über Zusammenhänge in den Daten bekommt. Das gelingt nach meiner Erfahrung häufig am besten, wenn man mehrere Modelle vergleicht und betrachtet, wie sich Effekte verändern, wenn Variablen hinzugefügt oder weggelassen werden. D. h. man sucht dann nicht „das eine perfekte Modell“. Bezogen auf a) könnten Sie somit Modelle mit und ohne die nicht am Interaktionsterm beteiligte UV vergleichen. Es ist natürlich immer eine Frage des Aufwands. Es ist in der Regel nicht möglich, alle Eventualitäten und Wechselwirkungen zu testen und zu interpretieren. Man braucht auch ein wenig Pragmatismus, um zu einem Ergebnis zu gelangen, und kann im Hinterkopf behalten, dass sich das Ergebnis ändern kann, wenn weitere Wechselwirkungen bekannt werden. Beispiel: Eine zusätzliche Kontrollvariable könnte eine Scheinkorrelation oder eine verdeckte Korrelation anzeigen.

      Hoffe das hilft ein wenig. Viel Erfolg!

  6. Hallo Wolf,

    danke für die tolle Seite! Ich schreibe gerade meine Abschlussarbeit und diese beinhaltet ebenfalls eine Regression inkl. Moderation. Dazu hätte ich zwei Fragen, bei denen ich leider nicht alleine weiterkomme:

    Die erste Hypothese untersucht nur den Zusammenhang einer UV auf eine AV. Der Koeffizient der UV ist signifikant, das gesamte Modell laut ANOVA (F-Test) aber nicht, da p >.05. Darf ich den Koeffizienten trotzdem interpretieren oder muss ich meine Hypothese (UV hat einen positiven Effekt auf AV) verwerfen, weil das gesamte Modell nicht signifikant ist?

    In meiner Moderation ist der Interaktionsterm und die UV nicht signifikant, der Moderator aber schon. Die Hypothese muss ich verwerfen, aber darf ich trotzdem Aussagen über den Moderator treffen?

    Vielen vielen Dank schonmal!

    1. Hallo Juliane,

      der erste Punkt kommt mir seltsam vor. Wenn es nur eine UV gibt, sollte der p-Wert der UV mit dem p-Wert der Anova für das Gesamtmodell übereinstimmen. Oder hast Du noch Kontrollvariablen drin? Ist das ein „normales“ lineares Regressionsmodell, oder ein anderes Modell?
      Unabhängig davon denke ich, die Interpretation ist „sauber“, solange Du die Ergebnisse vollständig berichtest, sodass der Leser sich auch ein Bild machen kann. Dann kann man ja schreiben, was man gefunden hat: sig. Koeffizient im Sinne der Hypothese, allerdings in insgesamt schwachem (nicht sig.) Modell. Diskutieren, woran das liegen könnte. Z. B. gibt es andere Einflüsse auf die AV, die nicht im Modell enthalten sind, etc.

      Punkt 2: Der Effekt des Moderators steckt in diesem Modell teilweise in der Moderatorvariable, teilweise im Interaktionsterm. Eine separate Interpretation nur des Moderator-Koeffizienten ist daher mit Vorsicht zu genießen. Es gibt Wechselwirkungen, auch wenn der Interaktionsterm nicht sig. ist. Ich empfehle ein zusätzliches Modell, das nur den Moderator als UV enthält. Dann kannst Du vergleichen und besser interpretieren.

      1. Danke für die super schnelle Antwort!
        Ja genau, das war ein lineares Regressionsmodell mit drei Kontrollvariablen und einer UV. Vielen Dank für die ausführlichen Erklärungen, das hilft mir auf jeden Fall weiter!

  7. Hallo Wolf, ich untersuche den Moderatoreffekt einer Produktkategorie (Technik und nicht Technik) von 4 verschiedenen Werbeanzeigen auf die Kaufabsicht. Die abhängige Variable ist ja metrisch (Kaufabsicht) aber unabhängige Variable mit den 4 Anzeigenvarianten ja nominal. Somit kann man hierfür ja keine Regressionsanalyse verwenden. Wie kann man das denn dann Testen?

    1. Hallo Susann,
      nominale Variablen kann man in Dummy-Codierung verwenden. Für jede Variante eine Variable à la „Variante 1“ gibt es zwei Ausprägungen: 0 = nein, 1 = ja. In einem Regressionsmodell genügen dann bei 4 Varianten 3 Dummyvariablen. Wenn alle drei den Wert 0 haben, muss es die vierte Variante sein. (Bedingung: Jeder Fall ist genau einer der vier Varianten zugeordnet.)
      Für Moderatoreffekte würde ich es so einfach wie möglich halten. Das heißt pro Modell nur einen Moderatoreffekt testen, d. h. eine Dummyvariable verwenden. D. h. jeder Effekt kann nur testen: Variante x ja vs nein. Du bräuchtest dann mehrere Modelle. Wenn Du versuchst, alles in ein Modell zu packen, wird die Interpretation schwierig, da es viele Wechselwirkungen gibt, die sich gegenseitig beeinflussen.

  8. Hallo Herr Riepl,

    vielen Dank für diese Seite!
    Ich habe auch eine Frage zu einer moderierten Regression.
    Alle Variablen sind bei mir intervallskaliert (3 Prädiktoren, 1 Kriterium). Ich rechne 2 Interaktionen zwischen jeweils dem einen Prädiktor (Persönlichkeit) mit den beiden anderen Prädiktoren als Interaktion (2 Moderationen also).
    Die Interaktionsterme haben keine signifikanten Regressionsgewichte und der Haupteffekt für Persönlichkeit ist auch nicht signifikant. Die anderen beiden Prädiktoren haben aber signifikante Betagewichte.
    Haben Sie Literaturtipps für Gründe nicht-signifikanter Interaktionen? Hab im Internet z.B. etwas zu verringerten Reliabilitäten bei Interaktionen gefunden, aber leider ohne seriösen Quellenangaben.

    Vielen Dank!
    Pauline Schmidt

    1. Hallo Frau Schmidt,
      zwei Anmerkungen:
      1. Ich rate davon ab, mehr als eine Interaktion im gleichen Modell zu verwenden (bin nicht sicher, ob Sie das getan haben). Die Wechselwirkungen bei mehreren Interaktionen im gleichen Modell werden sehr schwer überschaubar. Empfehlung: Separate Modelle mit jeweils einem Interaktionsterm.
      2. Das würde ich ganz simpel halten: Nicht signifikante Interaktion bedeutet: kein Hinweis auf eine Wechselwirkung. D. h. der Effekt des Prädiktors ist stabil, er hängt nicht von der Ausprägung des Moderators ab.
      Viel Erfolg & viele Grüße
      Wolf

  9. Hallo! Super Seite!
    Hätte eine Frage zu meiner moderierten Regression.

    Meine AV ist die Resilienzskala (metrisch), meine UV ist Alkoholabhängige und nicht Alkoholabhängige (dummy kodiert) und der Moderator Zufriedenheit mit sozialen Kontakten (metrisch).

    Der Interaktionskoeffizient ist negativ (-0.9) und die anderen UV sind positiv. (alle sind sig.)

    Ich habe Schwierigkeiten das Ergebnis zu interpretieren und darzustellen.
    Vielleicht hast du ja eine Idee.

    LG

    1. Hallo,
      ich finde es auch schwierig, nur nach den Vorzeichen zu gehen. Empfehle unbedingt grafische Darstellung, das macht es wesentlich einfacher.

  10. Hallo Wolf,

    ich habe eine multivariate Regression berechnet und möchte nun den Moderatoreffekt prüfen. Ich habe allerdings zwei positive Haupteffekte die auch beide Signifikant sind und dann einen negativen Interaktionseffekt herausgebkommen. Probleme habe ich jetzt bei der inhaltlichen Interpretation, vielleicht können sie mir dabei ja helfen.

    Meine Unabhängigen Variablen sind hierbei

    1. Hochschulreifen (0/1 skalierung)
    2. Nettoeinkommen (in 1000 Euro, mittelwertzentriert)

    Haupteffekt Hoschulreife: b=0,285 (p<0,000)
    Haupteffekt Nettoeinkommen (zentriert): b=0,259 (p<0,000)
    Interaktionseffekt: b=-0,134 (0,000)

    Untersucht werden soll die Moderatorwirkung von hoher Schuldbildung auf die Beziehung zwischen Nettoeinkommen und der allgemeinen Lebenszufriedenheit (= Abhängige Variable, 11er Ratingskala 0: ganz zufrieden.. 10:ganz unzufrieden).

    Ich währe ihnen sehr dankbar, wenn Sie mir bei der Interpretation des Ergebnisses behilflich sein könnten!

    Vielen Dank

    1. Hallo Katharina,
      ich würde es grafisch darstellen, das erleichtert die Interpretation. Nettoeinkommen auf der x-Achse, Lebenszufriedenheit auf der y-Achse, zwei Regressionsgeraden für Hochschulreife 0/1.

  11. Hallo Herr Riepl,

    tolle Seite. Hat mir bisher sehr weitergeholfen.
    Ich schreibe selbst gerade meine Abschlussarbeit und sitze an einer moderierten Regression mit SPSS und bräuchte eine Anregung.

    Folgendes Modell:

    Meine abhängige Variable ist: Affektives Commitment (metrisch)
    Meine unabhängige Variable ist: HR Maßnahmen im Unternehmen vorhanden oder nicht (binär -> Antwortauswahl Ja/Nein -> kodiert als Dummyvariable -> 0=nein, 1=ja).
    Nun möchte ich den Zusammenhang der Variablen mit Hilfe von drei Moderatoren berechen.
    Moderatoren:
    – Geschlecht (binär -> 0=weiblich, 1=männlich -> kodiert als Dummyvariable)
    – Alter (metrisch, mean centered)
    – Bildungslevel (metrisch, meancentered).

    Für jeden Moderator habe ich jeweils einen Interaktionsterm gebildet (UV * DummyVariableGender beziehungsweise UV * meancenteredModerator).
    Ich habe jeweils einzeln für jeden Moderator eine moderierte Regression durchgeführt. Ich habe dies bereits gerechnet und die Moderation mit dem Geschlecht ist signifikant und die Moderation mit Alter und Bildungslevel jedoch nicht.

    Ist dies generell so möglich? Oder haben Sie dafür eine bessere Lösung?

    Und wie füge ich Kontrollvariablen ein? Meine Kontrollvaribalen sind Unternehmensgröße (metrisch, meancentered), Anzahl der Kinder (metrisch, meancentered) und Gehalt (metrisch, meancentered). Kann ich die jeweiligen Interaktionenterme einfach bei SPSS in das Feld für die unabhängige Variable zusätzlich hinzufügen (als zweites Modell)? Oder was muss ich da genau beachten?

    Vielen Dank im Voraus.
    Viele Grüße,
    Julia

    1. Hallo Julia,
      1. Ja: Ich würde nicht mehr als einen Interaktionsterm pro Modell verwenden. Also separate Modelle. Die Wechselbeziehungen zwischen den Modellvariablen werden sonst sehr unübersichtlich.
      2. Kontrollvariablen: Einfach als unabhängige Variablen aufnehmen. Technisch gibt es keinen Unterschied zwischen „Modellvariable“ und „Kontrollvariable“ – das ist nur ein Blickwinkel der Interpretation.
      Ja, es kann sinnvoll sein, Modelle ohne und mit Kontrollvariablen zu vergleichen. Spannend ist bei solchen Fragestellungen (Hypothesentests) nicht so sehr „das eine, perfekte Modell“, sondern oft Veränderungen von Effekten zwischen verschiedenen Modellen. Z. B. ist ein Effekt nach Aufnahme von Kontrollvariablen nicht mehr signifikant? (Evtl. Scheinkorrelation.) Oder wird ein Effekt erst signifikant, wenn man eine bestimmte Kontrollvariable aufnimmt? (Evtl. verdeckte Korrelation.)

      1. Hallo Herr Riepl,
        Vielen Dank. Das hat mir sehr weitergeholfen.
        Ich habe das mit den Kontrollvariablen umgesetzt.

        Haben Sie noch einen Tipp, wie ich diese Werte in einer Tabelle in meiner Abschlussarbeit darstellen kann?
        Also einmal das jeweilige Modell ohne Einbezug der Kontrollvariablen und einmal mit Einbezug der Kontrollvariablen? Ich soll dies in einer einzigen Tabelle darstellen (mit allen drei Moderatoren + Kontrollvariablen). Stecke da jedoch momentan etwas fest.

        Viele Grüße,
        Julia

        1. Hallo Julia,
          ein allgemeingültiger Tipp ist etwas gefährlich, weil es in unterschiedlichen Fachbereichen unterschiedliche Konventionen für die Darstellung geben kann. Ich würde in vergleichbaren Publikationen nachsehen (vom Prof. / Betreuer, andere Abschlussarbeiten beim gleichen Betreuer, Fachzeitschriften).
          Anregungen für Tabellen hier – den Code elegant überspringen, nur auf die Tabellen schauen:
          https://cran.r-project.org/web/packages/sjPlot/vignettes/tab_model_estimates.html

  12. Lieber Wolf,
    ich rechne in meiner Masterarbeit Moderationen mit Process aus. Nun habe ich bei allen vier Moderationsanalysen einen signfiikanten Interaktionseffekt, allerdings immer einen ichtsignifikanten Haupteffekt. Heißt dass, der Moderator hat trotzdem einen signifikanten Einfluss? Lieben Dank!

    1. Hallo Steffi,
      die Herausforderung besteht darin, dass man bei Modellen mit Interaktionseffekten keins der beteiligten Merkmale mehr unabhängig interpretieren kann: Ein Teil des Effekts steckt im Interaktionsterm, ein Teil in den einzelnen Variablen (Haupteffekten). Erst mal ist es plausibel, dass der Moderator offensichtlich einen Einfluss hat, wenn die Interaktion signifikant wird. Zusätzlich könntest Du noch ein Modell aufstellen ohne Interaktionsterm und damit die Haupteffekte einzeln interpretieren.
      Ich nenne das „Mosaik-Ansatz“: Es gibt in diesem Kontext nicht das „eine, perfekte“ Modell; oft erhält man die Einblicke durch den Vergleich verschiedener Modelle und darüber, wie sich Effekte verändern.

  13. Lieber Wolf,
    dein Beitrag hat mir sehr für mein Modell (und die grafische Darstellung dessen) geholfen, danke dafür!
    Nun komme ich bei folgenden Fragestellungen nicht weiter und wäre unendlich dankbar für Hilfe.

    Ich habe ein Regressionsmodell mit insgesamt 5 UV und eine metrische AV. Eine der UV (UV1) ist eine Gruppierungsvariable (gruppierung der Fälle nach Zeitraum: Fall ist in t0 bzw. t1 aufgetreten). Nun möchte ich die Wechselwirkung der restlichen vier UV mit der Gruppierungs-UV (UV1) testen und habe ein weiteres Regressionsmodell mit 4 Interaktionstermen erstellt.
    Nur einer der Interaktionsterme wird stat. signifikant, diesen Effekt habe ich grafisch dargestellt – er sieht etwa aus wie dein Bsp.3, nur dass die linken Enden der Linien sich nicht treffen, sondern ein geringer Abstand besteht

    UV1, UV2 und Interaktionsterm sind dichotom (0, 1). Zur Grafik: die Linien schneiden sich nicht, beide fallen jedoch von t0 zu t1 ab, wobei die obere Linie (UV2 = 0) deutlich steiler abfällt.
    Nun habe ich Schwierigkeiten mit der Interpretation:

    1) Die UV hat im Haupteffektmodell einen negativen nicht-standardisierten Regressionskoeffizienten, die Moderatorvariable hat einen positiven und der Interaktionsterm im Interkationseffektmodell wieder einen negativen Koeffizienten. Ich habe irgendwo gelesen, dass wenn das Vorzeichen des Interaktionsterms und der UV1 übereinstimmen, wird der Effekt der UV1 auf die AV durch die Interaktion verstärkt. Ist das richtig so?

    Also: Durch das Vorliegen der Ausprägung UV2=1 wird der Effekt der Gruppierungsvariable UV1 auf die AV verstärkt.

    Vielen Dank im Voraus für Ihre Antwort und viele Grüße
    Lilly

    1. Hallo Lilly,
      erst mal zum Modell: Ich rate davon ab, mehrere Interaktionsterme im gleichen Modell zu verwenden. Das gibt ziemlich komplizierte Variablen-Beziehungen. Ich würde es so einfach wie möglich halten. Wenn vier Interaktionen interessant sind, würde ich vier separate Modelle aufstellen, jedes mit einer Interaktion. Dann sollte die Interpretation etwas einfacher werden.
      Unter welcher Bedingung (UV2=1 oder UV2=0) die Beziehung zwischen UV1 und AV verstärkt wird, müsste sich an der Grafik ablesen lassen: Welche Gerade verläuft steiler? Das finde ich klarer als die Kombination der Vorzeichen.
      Wenn es unklar bleibt, könntest Du folgende Alternative versuchen: Teile den Datensatz in die Teile UV2=1 und UV2=0. Stelle für jeden Teildatensatz ein Regressionsmodell der UV1 auf die AV auf. Vergleiche die Koeffizienten. Welcher ist absolut gesehen größer (wenn ich Dich richtig verstanden habe: stärker negativ)?
      Hoffe das hilft – viel Erfolg!

      1. Lieben Dank, das hat mir tatsächlich geholfen. Die obere Gerade verläuft steiler, der Abstand zwischen den beiden Geraden wird nach rechts hin kleiner. Ich habe die Interaktionen nun auch in jeweils einzelnen Modellen (nur UV1, UV1 und Interkationsterm) getestet und tatsächlich werden noch mehr Interaktionsterme signifikant. Ich kann allerdings keine Quelle finden, die dieses Vorgehen befürwortet – weißt du hier weiter?
        VG

        1. Literatur: Hab jetzt keine zitierfähige Stelle parat … Weiß nicht, ob das sein muss. Ich würde es aus eigenen Überlegungen heraus begründen. Sobald man mehr als eine Variable im Modell hat, gilt der Effekt einer Variable „unter Konstanthalten aller anderen“. D. h. sobald es Korrelationen zwischen den Variablen gibt, ändern sich Effekte, wenn man Variablen zusätzlich aufnimmt bzw. Variablen ausschließt. D. h. es gibt Wechselwirkungen. Bei Interaktionstermen gilt das ganz besonders, denn hier gibt es ja praktisch immer Korrelationen zwischen UV, Moderator und Interaktionsterm. Mit mehr als einem Interaktionsterm vervielfachen sich die Wechselwirkungen und die Interpretation wird entsprechend unübersichtlich.

          1. Das macht Sinn, ja. Mein Haupteffektmodell besteht ja aber aus 5 UV, für die Interaktionseffekte würde ich ja jeweils nur 2 UV + Interaktionsterm testen. Kann ich mich in der Interpretation dann dennoch auf das Haupteffektmodell beziehen oder müsste ich für jedes Interaktionsmodell erst noch ein Haupteffektmodell erstellen, dass nur die beiden UV enthält?

          2. Wenn die UVs korrelieren (was nicht unwahrscheinlich ist, aber ich kenne die Daten nicht), werden sich Haupteffektmodelle mit unterschiedlich vielen UVs (mehr oder weniger deutlich) unterscheiden. Also wäre es wohl sinnvoll, zum jedem Interaktionsmodell das „passende“ Haupteffektmodell zu erstellen.
            Falls die Unterschiede gering sein sollten (z. B. Koeffizient von UV3 in einem Modell mit weniger UVs vs. Haupteffektmodell mit allen UVs), könntest Du das ja im Text beschreiben, ggf. ohne alle einzelnen Modelle so ausführlich darzustellen.

  14. Lieber Wolf,
    ich hänge gerade am richtigen Vorgehen für die Moderation. Meine UV ist intervallskaliert, der Moderator dichotom (Geschlecht) und die AV intervallskaliert.
    1) Ist es korrekt, dass ich erst bei Feststellung von Multikollinearität zentriere?
    2) Bei der Zentrierung selbst: Wird die UV zentriert, der Moderator nicht, da dichotom (Hier jedoch umcodieren in 0 und 1, da bisher Mann 1 und Frau 2 codiert wird)?
    3) Werden Kontrollvariablen auch zentriert?

    Ganz viele Grüße 🙂
    Kristin

    1. Hallo Kristin,
      ich weiß nicht, ob es da eine einfache Richtig-Falsch-Antwort gibt. Zentrieren verändert die Interpretation (z. B. Konstante). Den dichotomen Moderator würde ich nicht zentrieren. Du kannst ja verschiedene Varianten vergleichen, um zu sehen, wie sich das jeweils auswirkt, wie sich die Modelle verändern, welches Bild sich für die Interpretation ergibt.
      Mir hat es geholfen, von der Denkweise „Ich will das eine richtige Modell finden“ zu der Denkweise überzugehen: Interessante Einblicke in meine Daten erhalte ich oft eher aus dem Vergleich verschiedener Modelle als aus dem „einen richtigen“ Modell.

  15. Lieber Herr Riepl,

    ich schreibe derzeit meine Bachelorarbeit und komme bei einer statistischen Fragestellung zur Moderatoranalyse nicht weiter:

    ich habe eine hierarchisch moderierte Regression mit Kontrollvariablen gerechnet und zuvor weder den Prädiktor noch die angenommene Moderatorvariable zentriert. Im Ergebnis waren die VIF-Werte > 10 relativ hoch.

    Im Anschluss habe ich zunächst die Moderatorvariable zentriert, was die VIF-Werte deutlich gesenkt hat. Im Ergebnis war im ersten Modell zunächst nur die angenommene Moderatorvariable signifikant. Mit Hinzunahme des Interaktionsterms im zweiten Modell waren weder die Moderatorvariable noch der andere Prädiktor oder der Interaktionsterm signifikant. Das blieb im dritten Modell mit Hinzunahme der Kontrollvariablen auch so.

    Wenn ich nun aber neben der Moderatorvariable auch den Prädiktor zentriere, ändert sich das Ergebnis. Die Moderatorvariable bleibt auch mit Hinzunahme des Interaktionsterms (Modell 2) und den Kontrollvariablen (Modell 3) signifikant, der Interaktionsterm sowie der andere Prädiktor sind nicht signifikant.

    Welches Vorgehen ist denn nun richtig? Muss ich (wenn ich zentriere), immer sowohl die Moderatorvariable als auch den Prädiktor zentrieren oder nur die Moderatorvariable?

    Ich tue mich auch mit der Ergebnisinterpretation schwer:
    eine Moderation liegt nicht vor, da der Interaktionsterm ja nicht signifikant ist. Wie interpretiere ich denn dann den signifikanten Einfluss der angenommenen Moderatorvariable in Verbindung mit dem anderen nicht-signifikanten Prädiktor? Das alles verwirrt mich zunehmend.

    Es wäre super, wenn Sie mir weiterhelfen könnten, da ich schon längere Zeit vergeblich nach einer Antwort in der Fachliteratur suche.

    Vielen Dank und Grüße
    Claudia

    1. Hallo Claudia,

      ich würde klären, worauf die hohen VIF-Werte (starke Multikollinearität) zurückzuführen sind. Zwischen welchen Variablen besteht die starke Korrelation? Moderator und Prädiktor? Prädiktor und Kontrollvariable(n)? Vielleicht ist eine Kontrollvariable verzichtbar, die ohnehin sehr stark mit anderen Merkmalen korreliert.

      Zum Zentrieren gibt es (leider) unterschiedliche Empfehlungen. Wahrscheinlich ist es besser, zuerst die Multikollinearität in den Griff zu bekommen, danach sollte die Modellierung / Interpretation einfacher werden. Durch Zentrieren ändert sich die Interpretation der Koeffizienten und der Konstante, da sich der 0-Bezugspunkt ändert.
      https://www.researchgate.net/post/While_testing_moderating_effect_is_it_necessary_to_center_the_variables

      Im Modell mit Interaktionsterm ist die Interpretation der einzelnen Koeffizienten schwierig: Der Effekt eines Prädiktors (der im Interaktionsterm enthalten ist – gilt für Prädiktor und Moderator) steckt nun nicht mehr in einem Koeffizienten allein, sondern in beiden gemeinsam: Der Variable „einzeln“ und dem Interaktionsterm.

      In Ihrem Fall klingt es so, als ob nur der Moderator einen (statistisch abgesicherten) Einfluss auf die abhängige Variable hat.

      Ich empfehle grafische Darstellungen, wenn möglich.

      Haben Sie auch Modelle ohne Interaktionsterm aufgestellt? Ich würde alle vergleichen: 1. Nur Prädiktor, 2. nur Moderator, 3. Prädiktor und Moderator, aber ohne Interaktionsterm, 4. Volles Modell mit Prädiktor, Moderator und Interaktionsterm.

      Viel Erfolg
      Wolf

      1. Hallo Herr Riepl,

        vielen Dank für Ihre Hinweise! Das hilft mir bereits weiter. Nur bin ich ratlos, was für eine grafische Darstellung in diesem Fall hilfreich wäre.

        Ich habe vor den eigentichen Hypthesentestungen eine Korrelationsanalyse der beteiligten Variablen durchgeführt. Hier waren keine extremen Korrelationen zu erkennen. Die höchste Korrelation bestand zwischen dem Prädiktor und der angenommenen Moderatorvariable (-.350).
        Der VIF-Wert der Moderatorvariable liegt ohne die Zentrierung breits im ersten Modell – also nur Prädiktor und Moderatorvariable – bereits über 10.
        Wenn ich allerdings den Moderator zentriere, liegen die VIF-Werte im gesamten Modell bei unter 5. Demnach muss ich wohl den Moderator zentrieren, da ich die Multikolleniarität auf keinem anderen Weg reduzieren kann. Ich habe im ersten Modell ja nur zwei Variablen und diese benötige ich beide für die Hypothese.

        Es stimmt, dass bislang nur die angenommene Moderatorvariable einen signifikanten Einfluss hat. Je nachdem, ob ich ebenso den Prädiktor zentriere, verschwindet dieser signifikante Einluss aber mit Aufnahme des Interaktionsterms.
        Ist es mögich, dass primär ein nicht-linearer Zusammenhang vorliegt und ich es nur nicht merke?

        Bisher habe ich die hierarchische Regression wie folgt aufgebaut:
        Modell 1: Prädiktor und angenommene Moderatorvariable
        Modell 2: Prädiktor, angenommene Moderatorvariable und Interaktionsterm
        Modell 3: Prädiktor, angenommene Moderatorvariable, Interaktionsterm und Kontrollvariablen

        Viele Grüße
        Claudia

        1. Hallo Claudia,
          es gibt manchmal Fälle von Multikollinearität „in höheren Dimensionen“, die sich nicht an der Korrelationstabelle zwischen jeweils zwei Variablen zeigt. Z. B. Variablen x1 und x2 korrelieren gemeinsam (aber nicht so stark einzeln) mit x3. Das ist hier aber wohl nicht der Fall, zumindest spricht Ihre Beschreibung von Modell 1 dagegen.
          Nichtlinearität könnte eine Erklärung sein für den hohen VIF-Wert im ersten Modell.
          Das könnten Sie untersuchen: z. B. vergleichsweise mit einem Modell mit quadratischem Term, oder grafisch mit einem Streudiagramm mit Lowess-Anpassungskurve.
          Das nur als Möglichkeit – vielleicht genügt es auch, die Befunde sorgfältig zu beschreiben und bestmöglich zu interpretieren. Neulich sagte ein Kursteilnehmer so schön: Das Problem sind ja nicht die Modelle, das Problem ist die Realität …
          Zur ersten Frage, welche Grafik? Vorschlag: Abhängige Variable auf der y-Achse, Prädiktor auf der x-Achse, Regressionsgeraden für hohe und niedrige Ausprägung des Moderators.

          1. Lieber Herr Riepl,

            vielen Dank für Ihre Erklärung. Da wir uns im Bachelorstudiengang nicht mit Nichtlinearität beschäftigen, werde ich wohl bei der ausführlichen Befundbeschreibung bleiben (auch, wenn es mich schon interessieren würde). Aber allein die Erklärung, dass Nichtlinearität hierfür verantwortlich sein könnte, bringt mich um einiges weiter.
            Vielen Dank dafür!

  16. Werter Herr Riepl,
    ich bin derzeit am Schreiben meiner Abschlussarbeit und möchte untersuchen, ob und inwiefern durch die Produktpräsentation eines Influencers (im Vgl. zu einem normalen Werbebanner) die sensorische Wahrnehmung von Produkteigenschaften beeinflusst werden kann und ob diese Form der Produktpräsentation einen Einfluss auf bestimmte Konsumentenreaktionen (Kaufabsicht etc.) besitzt. in diesem Zuge habe ich 3 Moderatorvariaben identifizieren können: Vertrauen, Authentizität und Glaubwürdigkeit. Nun stellt sich mir die Frage wie ich den Einfluss jeder einzelnen Moderatorvariablen auf bestimmte Konstrukte untersuchen kann.

    Kurz zur Veranschaulichung des Effektes, den ich untersuchen möchte:

    Produktpräsentation des Influencers —————-> z.B. Kaufabsicht [auf diesen Wirkungszusammenhang wirkt nun eine der drei Moderatorvariablen, nehmen wir an Vertrauen]

    abhängige Variable: Kaufabsicht

    Da allerdings meine unabhängige Variable nun die Produktpräsentation (PP) ist, die in meinem Fragebogen randomisiert zugelost wurde (Ausprägungen: 1=Influencer-PP; 2=Werbebanner PP) bin ich mir ziemlich unschlüssig wie ich ich dort jetzt den Moderatoreffekt bzw. Interaktionseffekt des Vertrauens berechnen kann. Alle anderen Konstrukte habe ich mithilfe von Multi-Itemskalen (Likert) gemessen.

    Ich freue mich auf Ihre Antwort und Lösungsvorschlag

    Mit freundlichen Grüßen

    1. Hallo Matthias,
      wenn ich es richtig verstehe, ist der Knackpunkt: Wie kann die Produktpräsentation mit zwei Ausprägungen in den Moderatoreffekt eingehen? Technisch ist der Interaktionsterm das Produkt aus UV und Moderator: ganz wörtlich die Multiplikation der beiden Variablen. Das gilt auch für Variablen mit nur zwei Ausprägungen, auch wenn das „komisch“ aussieht.
      Die konkrete Umsetzung kann in verschiedenen Statistikprogrammen unterschiedlich sein. In SPSS habe ich früher eine neue Variable berechnet, die buchstäblich die Multiplikation der beiden Variablen (UV und Moderator) enthielt:
      z. B. Interaktionsterm = Produktpräsentation mal Vertrauen.
      Empfohlen wird dann, sowohl den Interaktionsterm als auch die beiden Variablen einzeln in das Modell aufzunehmen.
      z. B. Kaufabsicht = Vertrauen + Produktpräsentation + Interaktionsterm

      In R muss man dem Datensatz keine neue Variable hinzufügen, man kann die Interaktion direkt in der Modellformel angeben.
      Kurzschreibweise: Modell <- lm(Kaufabsicht ~ Vertrauen:Produktpräsentation) Gleichbedeutend mit: Modell <- lm(Kaufabsicht ~ Vertrauen + Produktpräsentation + Vertrauen * Produktpräsentation) Hoffe das hilft - viel Erfolg! Wolf

  17. Lieber Herr Riepl,
    Ich schreibe gerade an meiner Masterarbeit und hätte eine Frage an Sie. Ich weiß, dass bereits ähnliche Fragen gestellt wurden, kann die Antworten aber leider nicht auf meine Daten anwenden… Vielleicht können Sie mir ja weiterhelfen.

    Ich möchte untersuchen ob der Einfluss von Agilem Arbeiten (UV, metrisch) auf Projekterfolg (AV, metrisch) durch das Erfüllen verschiedener Projekteigenschaften (Moderator, kategorial mit 3 Stufen) moderiert wird. Dafür habe ich den Moderator schon in 2 Dummy-Variablen kodiert. Ich bin mir jedoch nicht sicher wie ich weiter vorgehen soll.

    Bilde ich nun 2 Interaktionsterme (also aus Agilität x jeweilige Dummy Variable)? Und füge ich dann in mein Regressionsmodell beide Interaktionsterme ein, oder rechne ich ein getrenntes Modell für jeden Dummy-Moderator?
    Weiterhin bin ich mir nicht sicher, was eine signifikanter Einfluss eines Interaktionstermes dann genau aussagen würde.

    Vielen Dank im Voraus für Ihre Hilfe!

    Liebe Grüße
    Timo

    1. Hallo Timo,
      ich würde es vermeiden, mehr als einen Moderator im gleichen Modell zu haben. Mit einem Moderator ist es ja schon so, dass der Effekt einer Variablen nicht mehr nur an einem Term abzulesen ist, sondern an zweien: Der Variable einzeln und dem Interaktionsterm. Bei mehr als einem Interaktionsterm gibt es noch mehr Wechselwirkungen und damit Kombinationsmöglichkeiten und ich fände die Interpretation mehr als herausfordernd. Muss gestehen, dass ich seit einer Weile keine konkreten Projekte mit komplexeren Wechselwirkungen bearbeitet habe. Vielleicht lohnt sich ein Blick auf aktuelle Literatur dazu.
      Ich würde zwei Modelle aufstellen, vergleichen und diskutieren. Wenn ein drittes (mit der dritten Ausprägung der Projekteigenschaften) zusätzliche Erkenntnis bringt, dann das mit verwenden.
      Generell finde ich die Interpretation grafisch einfacher als nur numerisch.
      Viel Erfolg!
      Wolf

  18. Lieber Wolf
    Eine sehr interessante Seite! Ich hab dazu noch eine Frage: Ich bin zurzeit an der Auswertung meiner Daten anhand eines multiplen Regressionmodells. Nun habe ich den Interaktionsterm eingefügt, welche nucht signifikant ist. Dennoch möchte ich diesen grafisch darstellen. Wie kann ich eine solche Grafik ich R erstellen bzw. welchen Code/Befehl hast du für deine Grafiken verwendet?

    Vielen Dank für deine Hilfe!
    Liebe Grüsse aus der Schweiz
    Michelle

    1. Hallo Michelle,
      ich habe ggplot2 verwendet. Um die Interaktion zu zeigen, würde ich Gruppen als Ästhetik definieren (z. B. Farbe) und dann Anpassungsgeraden mit geom_smooth einfügen. geom_smooth „erbt“ die Ästhetiken und erstellt automatisch zwei Geraden, wenn es zwei (Farb-)Gruppen gibt.

      Beispiel – Code bitte für Deinen Anwendungsfall anpassen:

      library(MASS)
      data(Boston)
      library(ggplot2)

      ggplot(Boston, aes(x = lstat, y = medv, color = factor(chas))) +
      geom_point(alpha = 0.8) +
      geom_smooth(method = „lm“, se = FALSE) +
      labs(x = „Bevölkerungsanteil mit niedrigem Status in Prozent“,
      y = „Median Wohnungspreis in 1.000 USD“,
      title = „Modell: lm(medv ~ lstat * chas, data = Boston)“) +
      scale_color_discrete(name = „Lage am Charles River?“) +
      theme(legend.position = „bottom“)
      ggsave(„lm_mit-Interaktion.png“)

  19. Guten Tag

    Eine wunderbare Seite:)
    Ich habe eine Frage, deren Antwort ich trotz Recherche immernoch nicht beantworten konnte…
    Ich habe eine nominal skalierte Moderatorvariable, welche nicht dummy ist, sondern 6 Ausprägungen annehmen kann (sozialdemokratisch, liberal, etc..) … die OLS-Regression konnte ich bereits rechnen in R. Nun weiss ich jedoch nicht, wie ich dies zu interpretieren habe.

    Vielen Dank im Voraus 🙂
    Zora

    1. Hallo Zora,
      weiß R, dass die Variable nominalskaliert ist? Du kannst sie als Faktor definieren – wie sieht es dann aus?
      Ich denke als Moderatoreffekt mit 6 Ausprägungen wird die Interpretation eher kompliziert. Ich würde das wohl in Zweier-Gegensatzpaare aufteilen, z. B. sozialdemokratisch ja/nein in einem Modell. Wenn alle Modelle wichtig sind, dann eben für jede Ausprägung ein Modell: liberal ja/nein als Moderator, usw.
      Wolf

      1. Lieber Wolf

        Vielen Dank für die schnelle Antwort:)

        ja ich habe die Variable als Faktor definiert:

        WFS_R = as.factor(c(„Sozialdemokratisch“, „Sozialdemokratisch“,“Konservativ“, „Post_Communist“, „Konservativ“,
        „Former_UdssR“, „Mediterran“, „Konservativ“, „Konservativ“, „Liberal“,
        „Post_Communist“,“Liberal“, „Mediterran“, „Former_UdssR“, „Sozialdemokratisch“, „Sozialdemokratisch“,
        „Post_Communist“, „Mediterran“, „Sozialdemokratisch“ ))

        Das habe ich mir auch überlegt, aber dann kann ich ja nur die Unterschiede betrachten und nicht ob die Interaktion signifikant ist? So wie ich meinen Output interpretiere, nimmt es einfach eine Ausprägung (Former_UdssR) als Referenzkategorie. Heisst das, dass ich einfach nur mit einer Ausprägung vergleichen kann?

        1. R behandelt die Variable im Modell nun so, als ob sie dummy-codiert wäre. Bei Dummy-Codierung „per Hand“ müsstest Du auch eine Variable weglassen und als Referenzkategorie interpretieren. Du kannst den Effekt jeder Kategorie im Vergleich zur Referenzkategorie interpretieren.
          Gibt es keine zusätzlichen Terme für die Interaktion?

          1. Hmm.. Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?

            Doch den gibt es:
            OLS_Reg1 <- lm(Einst_Immigr ~ election + WFS_R + election * WFS_R, df_country)

            R gibt mir auch signifikante Werte aus.
            Das ist der Output von der OLS-Regression:

            Einfluss von RPP auf Einstellung und WFSR

            Dependent variable:

            Einst_Immigr

            election 7.259**
            (2.981)

            WFS_RKonservativ 0.635**
            (0.232)

            WFS_RLiberal 0.620**
            (0.232)

            WFS_RMediterran 0.636**
            (0.232)

            WFS_RPost_Communist 0.543*
            (0.233)

            WFS_RSozialdemokratisch 0.654**
            (0.232)

            election:WFS_RKonservativ -7.325**
            (2.983)

            election:WFS_RLiberal -7.410**
            (2.988)

            election:WFS_RMediterran -8.988**
            (3.034)

            election:WFS_RPost_Communist -7.299**
            (2.982)

            election:WFS_RSozialdemokratisch -7.528**
            (2.983)

            Constant 0.107
            (0.231)

            Observations 19
            R2 0.918
            Adjusted R2 0.789
            Residual Std. Error 0.019 (df = 7)
            F Statistic 7.106*** (df = 11; 7)

            Note: *p**p***p<0.01

          2. Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?
            Man kann vergleichen, wie jede Kategorie im Verhältnis zur Referenzkategorie dasteht. Ein Jeder-mit-jedem-Vergleich (ähnlich post-hoc bei ANOVA) ist hier nicht vorgesehen.

            Das Modell halte ich für schwer interpretierbar. Jeder Effekt ist zu interpretieren unter der Prämisse, dass alle anderen Effekte konstant gehalten werden. Das ist jedoch problematisch, da die Interaktionseffekte nicht von einander unabhängig sind. Das heißt: Die Effekte werden anders aussehen, wenn man separate Modelle aufstellt mit jeweils nur einem Interaktionsterm. Es gibt im obigen Modell sehr viele Wechselwirkungen, die sich gegenseitig beeinflussen.

  20. Hallo Zusammen,

    ich habe zur Identifikation verschiedener Prädiktoren und Moderatoren lineare bzw. multivariate Regressionen gerechnet. Jetzt hat meine Betreuerin gesagt, dass ich das Ganze anhand eines Pfadmodells prüfen soll. Für die Prädiktoren (insgesamt 5) habe ich ein Pfadmodell erstellt, es gibt mir allerdings keine Angaben zum Chi2 sowie dem Modelfit (RMSEA) aus. Ich habe gelesen, dass das daran liegen kann, dass das Modell zu klein ist?! Eine Bekannte hat ein größeres Modell und nutzt den selben R-Befehlt und bekommt alle Werte ausgegeben. Kann es also daran liegen, dass es mit diesem Modell nicht möglich ist Werte angegeben zu bekommen?
    Außerdem frage ich mich mittlerweile, ob ihr Kommentar bezüglich des Pfadmodells ausschließlich auf die Prädiktoren bezogen war. Ich habe viel gelesen zu Pfadmodellen und immer nur Beispiele zur Mediation gefunden. Mittlerweile bin ich daher fast sicher, dass eine Moderation nicht in einem Pfadmodell getestet werden kann, da der Moderator eine UV ist. Oder gibt es dafür eine Möglichkeit, die mir nicht bekannt ist und selten verwendet wird (daher online nicht auffindbar)?

    Für die Prädiktoren habe ich mir außerdem die Kovarianzen ausgeben lassen, finde aber keine Information dazu ab wann Variablen „hoch“ kovariieren. Ich weiß, dass ein Wert nahe 0 sehr gut ist, aber wie sieht es beispielsweise mit Werten wie 0.56 aus?

    Vielen Dank bereits im Voraus für ihre Antwort.

    1. Hallo Ben,
      sorry, eine Ferndiagnose zu dem Pfadmodell kann ich leider nicht stellen.
      Kovarianzen sind von Einheiten der verwendeten Variablen abhängig und damit meines Erachtens nicht allgemeingültig interpretierbar. Standardisierte Maße wie Korrelationskoeffizienten sind dafür besser geeignet. Allerdings sind auch dann Zusammenhänge im Forschungskontext zu betrachten. Bei einer sozialwissenschaftlichen Fragestellung bewerte ich eine Korrelation anders als bei einer technischen Fragestellung (z. B. Produktionsprozess), bei der nicht gemessene Einflüsse viel besser kontrolliert werden können.

      1. Hallo,

        vielen Dank für die Antwort.
        Wissen Sie denn ob es generell möglich ist eine Moderation mit einem Pfadmodell zu testen?
        In allen Beispielen zur Moderation die ich gefunden habe werden immer nur Regressionen gerechnet..

  21. Guten Tag.

    Ich führe zum ersten Mal eine quantitative Analyse (Moderatoranalysen) durch und habe eine Frage bezüglich R-Studio:
    Meine AV, einige meiner UV und einige meiner potentiellen Moderatoren sind nicht normal verteilt. Wie gehe ich damit um? Kann ich die Moderatoranalyse trotzdem durchführen oder muss ich vorher einige Schritte durchführen? Ich habe z.B. von Bootstrapping gehört und bin unsicher, ob das in diesem Fall angebracht ist und wie man dies in R-Studio durchführt.

    Vielen Dank für Ihre Hilfe.
    Mfg Jule

    1. Hallo Jule,

      fehlende NV: schwer, das pauschal zu beantworten. Einige Anhaltspunkte: Je größer die Stichprobe, desto weniger fallen Abweichungen von der NV ins Gewicht. Wie wurde die fehlende NV ermittelt – per statistischem Test oder (auch) grafisch? Tests wie Shapiro-Wilk (oder auch Kolmogorov-Smirnov) werden gerade bei größeren Stichproben „leichter“ signifikant. Wenn die Abweichungen nicht allzu drastisch sind, kann man das dokumentieren und die Analysen dennoch durchführen – es gibt es etwas Ermessensspielraum und bei vielen Studien sind nicht alle Testvoraussetzungen streng erfüllt.

      Zum Bootstrapping: Da gibt es das Boot-Paket in Base R (Teil der Standard-Installation). Man schreibt die Analyse als Funktion und lässt diese Funktion „bootstrappen“, also z. B. 1000 Mal mit Zufallsstichproben mit Zurücklegen aus dem Datensatz schätzen. Dann erhält man Verteilungen der Kennwerte, die oft brauchbarer (realistischer) sind als Kennwerte, die mit statistischen Formeln geschätzt werden. Gibt Anleitungen zum Vorgehen im Netz.

      1. Hallo,

        vielen Dank für die schnelle Antwort.
        Mein Datensatz umfasst 284 Teilnehmer, er sollte eigentlich groß genug sein.
        Die Normalverteilung habe ich durch Histogramme sowie den Shapiro-Wirk Test beurteilt.
        Im Fall der Variable „sozialer Druck“ liegt er beispielsweise bei .0049 (was wahrscheinlich noch okay ist), während bei einigen anderen Variablen ein z.B. p-Wert von 6.184e^-07 ausgegeben wird. Die AV, auf welche mehrere UV und Moderatoren getestet werden, ist laut meinem Histogramm ebenfalls nicht normal verteilt und erhält den p-Wert 2.676e^-10 (welcher laut Google als p = .121 berechnet wird).

        Denken Sie bootstrapping ist in diesem Fall angebracht, um eine Normalverteilung zu generieren? Ich bin heute erst auf dieses Problem gestoßen und finde leider aktuell keine Antworten darauf, wann man bootstrapping durchführt und wann nicht. Soweit ich es verstanden habe, ist es allerdings eine Möglichkeit Probleme wie die ungleiche Verteilung zu umgehen. Anderseits kenne ich mich leider kaum in R aus, sodass ich unsicher bin, ob dies meine Kompetenzen nicht übersteigt.

        Vielen Dank für Ihren Rat.
        Mfg

        1. Achtung, 2.676e-10 = 0.0000000002676. Das ist keine „e-Funktion“, sondern sog. wissenschaftliche Notation. Die Zahl nach dem e gibt die Anzahl der Dezimalstellen an.
          Ich würde nicht nur auf p-Werte schauen. Wenn die Verteilungen optisch einigermaßen vertretbar sind, ist es ok. Histogramme können auch etwas irreführen, da sie von der Breite der Kategorien abhängig sind. (Kann man variieren, um einen besseren Eindruck zu bekommen.)
          Bootstrapping generiert keine Normalverteilung. Es hilft lediglich, Verteilungen von Parametern (z. B. Konfidenzintervalle) ohne ohne Annahmen über Verteilungen der Variablen zu schätzen. Die Schätzung erfolgt nicht auf Basis von Formeln (die bestimmte Verteilungen voraussetzen), sondern in Form einer Simulation. So, als ob man eben zum Beispiel 1000 Stichproben hätte statt nur einer.

          1. Ah okay, das heißt 3.151e-06 = 0,000003151 ?!
            Ich habe gedacht die p-Werte seien gerade deswegen relevanter, da die Histogramme optisch oft täuschen.
            Ich finde es allerdings irritierend, dass das Histogramm normal verteilt wird und der Shapiro-Wirk Test eine hohe Signifikanz verzeichnet.

            Wenn ich das richtig verstehe, kann ich die moderierte Regression also einfach rechnen ohne auf eine Alternative wie das Bootstrapping-Verfahren zurückzugreifen :).

            Da ich noch nie quantitativ geforscht habe und keine Hilfestellung der Uni erhalte, habe ich ziemliche Angst, dass mir ein Fehler unterläuft und nachher die Ergebnisse alle „falsch“ bzw. nicht interpretierbar sind.

            Mfg
            Jule

          2. 3.151e-06 = 0,000003151 Ja

            Kann man in R testen:
            3.151e-06 == 0.000003151
            [1] TRUE

            Die p-Werte sind tendenziell zu streng bei größeren Stichproben (N=284 zähle ich dazu). Ich würde die p-Werte der NV-Tests dokumentieren und diskutieren.
            Und ja, ich denke die Regression ist vertretbar.
            In der Statistik gibt es viele Ermessensspielräume, es geht mehr um Wahrscheinlichkeiten und Annäherungen und nicht um exakte Wahrheit – die findet man statistisch nicht. Daher ist es wichtiger, das Vorgehen gut zu dokumentieren. Es dürfte kaum eine Studie geben, die „perfekt“ ist in dem Sinne, dass alle Voraussetzungen exakt erfüllt werden. Wichtiger ist, dass man mit Bewusstsein für Möglichkeiten und Grenzen der Methoden vorsichtig interpretiert.
            Es hört ja nicht auf bei den Normalverteilungen. Die meisten Zusammenhänge sind „in Wirklichkeit“ nicht linear. Dennoch sind lineare Regressionsmodelle sinnvolle und nützliche Werkzeuge.
            „Alle Modelle sind falsch, aber manche sind nützlich.“ (All models are wrong, but some are useful.)

  22. Hallo.
    Ich teste zurzeit mehrere Moderationen.
    Es geht um unter anderem darum, ob Need to Belong (Moderator) den Zusammenhang zwischen Selbstkontrolle (UV) und Social Media-Prokrastination (AV) moderiert. Die Analyse findet in R statt und ich habe bereits die notwendigen Befehle.
    Meine Frage: Ich habe ein Referat einer Moderationsanalyse in dem nicht auf Kontrollvariablen getestet wird.
    Ist das üblich oder sollte ich Variablen wie Alter, Geschlecht etc. definitiv in das Regressionsmodell einfließen lassen?

    Vielen Dank
    Ismail

    1. Deine Entscheidung 🙂
      Genauer hinzuschauen und Kontrollvariablen zu testen ist keine schlechte Idee. Allerdings muss man entscheiden, wo man die Grenze zieht … Man könnte auch noch Wechselwirkungen (Interaktionen) testen oder nichtlineare Zusammenhänge – es gibt da viele Möglichkeiten und man wird nicht alle abdecken können. Meine Empfehlung ist, theoriegeleitet vorzugehen (und nicht „auf Verdacht“ ganz viel zu testen). Gibt es Gründe für die Annahme, dass Alter oder Geschlecht eine Rolle spielen?

      Oft ist es besser, sich etwas weniger vorzunehmen und das dafür sorgfältig auszuarbeiten, anstatt sich mit zu vielen Ideen zu verzetteln …

      1. Vielen Dank für die schnelle Antwort!
        Es gibt in der Theorie nicht wirklich Indikatoren für mögliche Kontrollvariablen. Also werde ich da auf jeden Fall weniger testen als zunächst überlegt.

        Ich habe noch eine Frage bezüglich der Voraussetzungen die zu testen sind.
        Bevor ich die Moderationen teste, untersuche ich den Zusammenhang zwischen der UV und AV.
        Ich versuche so Prädiktoren für Social Media-Prokrastination zu identifizieren.
        Nachdem ich eine bivariate Regression durchgeführt habe, die einen hohen signifikanten Zusammenhang zwischen habitualisierter Nutzung so Social Media-Prokrastination zeigt, habe ich nun die Voraussetzungen getestet.
        Der breusch-pragan Test hat jetzt ergeben, dass p < .005 ist und entsprechend Heteroskedastizität vorliegt.
        Ich weiß allerdings nicht wie ich damit nun umgehen muss.

        Danke schon einmal im Voraus !

        1. Vielleicht kannst Du herausfinden, woran es liegt. Wie sieht das Streudiagramm aus? Vielleicht ist der Zusammenhang nichtlinear? Wie sind die Residuen im Moderator-Modell verteilt – vielleicht sieht es da besser aus? Hat eine weitere Variable im Datensatz einen starken Einfluss, sodass ein Modell mit dieser Variablen besser aussieht?
          Auch wenn Du keine exakte Antwort herausbekommst, warum Heteroskedastizität vorliegt: Ergebnis dokumentieren und diskutieren.

          1. Okay, vielen Dank :).
            Ich kann die Analyse also trotzdem so durchführen und muss das Ganze nur am Ende diskutieren und versuchen einzuordnen? Ich habe nämlich befürchtet die Analyse jetzt nicht durchführen zu dürfen etc.

          2. Voraussetzungen sind oft verletzt … Schöner ist es natürlich, wenn man die Ursache findet und womöglich sogar beheben kann. Vielleicht liegt es auch an einzelnen Ausreißern …

  23. Vielen Dank für diesen ausführlichen Beitrag! Mein Datensatz erfüllt die Voraussetzungen nicht. Ich habe statt ANOVA und Pearson, Mann-Whitney Test gemacht und lineare multiple Regression berechnet mit dem Vermerk, dass es mir um reine Unterschiede geht. Soweit war mein Professor damit einverstanden. Bei der Moderation empfiehl er mir die Z standardisierte Variablen zu erstellen und damit rechnen. Ich habe aber keine Normalverteilung in den Residuen und sonst auch keine Normalverteilung. Also habe ich meine Variablen nicht mittelwertzentriert. Können Sie mir helfen das zu begründen? Denn bei der Zentrierung werden die Werte nur im Wertebereich um 1 bis -1 variieren, ansonsten ändert sich ja nicht viel. Er meinte, ich habe dann das Problem das ganze sinnvoll zu interpretieren. Mein Moderator ist dichotom, AV ist quasimetrisch, es kam raus, dass Interaktionseffekt signifikant von null verschieden ist. Ich möchte damit nur zum Ausdruck bringen, dass eine Kategorie trägt zur Erklärung der Varianz mehr bei als andere Kategorie. Deswegen habe ich es so begründet, dass die Haupteffekte nicht zu interpretieren sind und die Ergebnisse sind eher heuristisch zu betrachten. Kann ich das so machen und mit einer Quelle begründen, wenn ja mit welcher? Ich habe leider nichts gefunden.

    Vielen Dank! Und viele Grüße!

  24. Hallo Wolf,

    in meiner Moderatoranalyse ist die Interaktion nicht signifikant. Die Moderatorvariable und die Prädiktorvariable jedoch schon. Wie interpretiere und berichte ich dies nun richtig? Ein Moderatoreffekt liegt also nicht vor, da der Interaktionsterm nicht signifikant ist, richtig? Vielen Dank und viele Grüße, Max

    1. Hallo Max,
      ja, das klingt plausibel. Das heißt: Der Effekt des Prädiktors hängt nicht von der Ausprägung der Moderatorvariable ab. Anders formuliert: Es gibt keine Wechselwirkung zwischen Moderator und Prädiktor.
      Viel Erfolg und viele Grüße,
      Wolf

  25. Zunächst vielen Dank ihnen für ihre tollen Erklärungen.Allerdings habe ich noch eine Frage, auf die ich auch in den Kommentaren hier noch keine Antwort gefunden habe:

    Ich rechne zur Zeit ein Modell mit einem Interaktionseffekt. Einer meiner Haupteffekte und der Interaktionseffekt sind signifikant. Der andere Haupteffekt ist nicht signifikant.
    Was bedeutet dies für die Interpretation meines Modells?

    1. Hallo Justus,
      es gibt eine signifikante Wechselwirkung (Interaktion) zwischen den beiden Variablen, die den Interaktionsterm bilden. D. h. der Effekt der einen UV hängt vom Zustand der anderen UV ab. Darüber hinaus würde ich die beiden Haupteffekte im Modell beschreiben (einer sig., einer nicht). Wenn Du es ausführlicher machen willst, kannst Du noch zusätzlich ein Modell ohne Interaktionsterm aufstellen und die Ergebnisse vergleichen.
      Viele Grüße!
      Wolf

  26. Ich hätte auch eine Frage:

    In meiner Bachelorarbeit ist mein Modell signifikant, aber die einzelnen Parameter und die Interaktion nicht. Wie interpretiere ich dies nun ??
    Vielen Dank schonmal!!

    1. Hallo Carlotta,
      „Modell sig.“ heißt Anova (F-Test) insgesamt für alle Variablen sig., aber keine unabhängige Variable inklusive Interaktionsterm? Formulierungsvorschlag: Alle Variablen GEMEINSAM leisten einen signifikanten Erklärungsbeitrag, wobei kein einzelner Prädiktor signifikant wird. Ein Interaktionseffekt konnte nicht nachgewiesen werden.

      Das Modell ist insgesamt signifikant „besser“ als das Null-Modell ganz ohne Prädiktoren (das immer den Mittelwert der abhängigen Variable voraussagt). Jeder Prädiktor für sich genommen bleibt aber unter der Signifikanzschwelle.

  27. Hallo, vielen Dank für die ausführlichen Erläuterungen. Diese waren sehr verständlich und gut erklärt!
    Ich hätte noch eine weitere Frage:
    Ich gehe hypothethisch von einem negativen Effekt von UV1 auf die AV aus. Parallel dazu gehe ich auch von einem negativen Effekt von UV2 auf die AV aus. Zusätzlich gehe ich davon aus, dass der negative Effekt von UV1 auf die AV noch stärker, also noch negativer wird, wenn UV2 ansteigt. Also im Prinzip genauso wie in deinem dritten Beispiel.

    Frage: Ich habe einen Interaktionsterm (UV1 * UV2) kreiert und teste diesen via Regression auf AV. Gehe ich davon aus, dass das Vorzeichen des Interaktionskoeffizienten jetzt positiv oder negativ ist?

    In meinem Fall ist er nämlich negativ. Das verwirrt mich. Hätte gedacht, dass ich von einem positiven Interaktionseffekt ausgehe, da die Wirkung doch verstärkt wird (im Sinne von minus mal minus gleich plus).

    Liebe Grüße,
    Sebastian

      1. Das mache ich auch in der Arbeit. Meine graphische Darstellung sieht genauso aus, wie ihr drittes Beispiel. Allerdings habe ich eben auch genau diesen Interaktionseffekt in einem hierarchischen Multilevel Regressionsmodell. Und dort ist mein Interaktionskoeffizient negativ. Und das verwirrt mich.

        Anders gefragt: Ich geh von dem dem dritten Beispiel auf dieser Seite aus: „Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.“
        Wäre das Vorzeichen der Interaktion (wenn ich Nichtraucher oder Raucher mal nicht als Dummy, sondern als metrische Variable, z.B. gerauchte Zigaretten am Tag, abbilden würde) „Gerauchte Zigaretten am Tag“ x „Übergewicht“ positiv oder negativ?

        1. Das mag ich nicht so pauschal beantworten. Es hängt von allen Variablen im Modell ab, nicht vom Interaktionseffekt allein. Ggf. einfach anfangen und schrittweise Variablen aufnehmen. Jede Korrelation zwischen UVs kann die Effekte verändern.

          1. Okay, dann noch einmal anders gefragt 🙂
            Bedeutet ein negatives Interaktionsvorzeichen bei zwei Variablen die einen negativen Effekt auf die AV haben, dass der Einfluss von UV1 sich mit ansteigender UV2 näher in Richtung 0 oder negativer (im Sinne von stärker in Richtung – unendlich) verschiebt?

            Beide Variablen sind nicht Teil des spezifischen Modells.

          2. Die grafische Darstellung müsste die Frage beantworten … In der linearen Regression sind wir bei Geraden. D. h. die Gerade wird nicht bei 0 „abknicken“ – sie kann nur steigen oder fallen, oder parallel zur x-Achse verlaufen.

  28. Hallo Herr Riepl,

    erstmals vielen Dank für das verständliche Aufbereiten dieses Themas. Dadurch ist es mir, einem Anfänger in Sachen Statistik, gelungen, die Ergebnisse einer Moderatoranalyse zu visualisieren.

    Nun stelle ich mir jedoch die Frage, wie ich die Stärke des Moderatoreffektes quantifizieren kann.

    Beispiel: Anhand der Grafiken sehe ich zwar, dass der Moderator den positiven Zusammenhang zwischen meiner UV und AV abschwächt, jedoch würde ich gerne präzise feststellt, wie stark der Zusammenhang abgeschwächt wird. Können Sie mir weiterhelfen und sagen, woher ich die Stärke des Effektes entnehmen kann?

    Danke und viele Grüße

    1. Hallo Patrick,
      Sie können den Rückgang des Regressionskoeffizienten B der UV sowie die Veränderung des p-Wertes der UV beschreiben. Vergleichen Sie dazu das Modell ohne Interaktionsterm mit dem Modell mit Interaktionsterm. Dazu können Sie die Veränderung in R² ergänzen. Es gibt weitere Gütemaße wie AIC oder BIC.
      Zu Effektstärken gibt es eine Menge Literatur. Man kann aus einem R² Cohen’s f² berechnen, z. B. hier:
      https://www.danielsoper.com/statcalc/calculator.aspx?id=5
      Sie können beschreiben, wie f² ansteigt, wenn der Moderatorterm aufgenommen wird.

  29. Hallo Wolf,

    ich bin glaube ich gedanklich noch nicht so weit wie der Rest hier. Ich habe eine Umfrage erstellt mit einer 5-stufigen Likert Skala. 15 Fragen zum Thema Bewertung einer Führungskraft entlang eines Ideals, 6 Fragen zum Respekt ggü der Führungskraft. Der Moderator (auch 15 Fragen) ist die Eigenbewertung des Mitarbeiters über sich selbst über die Kriterien, die bereits bei der unabhängigen Variable genutzt wurden. Und ich würde eben gerne untersuchen, ob der Zusammenhang zwischen der Wahrnehmung der aktuellen Führungskraft als ideale Führungskraft und dem Respekt gegenüber dem aktuellen Vorgesetzten umso größer ist je mehr sie Eigenbewertung des Mitarbeiters der idealen Führungskraft entspricht. Muss ich nun mehrere Regressionen rechnen um die Tabelle von Jeremy Dawson füllen zu können? Die unteren 5 Zeilen sind klar, aber ich hab keine Ahnung was ich machen muss. Oder bin ich völlig auf dem falschen Weg?

    Unstandardised Regression Coefficients:
    Independent variable:
    Moderator:
    Interaction:

    Intercept / Constant:

    Means / SDs of variables:
    Mean of independent variable:
    SD of independent variable:
    Mean of moderator:
    SD of moderator:

    Vielen Dank für deine Hilfe.

    1. Hallo Sabine,
      wenn Du nicht sehr viele Modelle aufstellen willst, solltest Du die Items zu Skalen zusammenfassen. Z. B., indem Du den Mittelwert der entsprechenden Items berechnest. Davor empfiehlt es sich, zu testen, ob bzw. wie gut die Items zusammenpassen: mit Korrelationen und am besten auch Reliabilitätsanalysen. Evtl. musst Du Items umpolen, falls sie inhaltlich in entgegengesetzte Richtungen weisen. (z. B. Zufriedenheit mit x von 1 bis 5 (5 = sehr zufrieden) vs. Unzufriedenheit mit y von 1 bis 5 (5 = sehr unzufrieden).
      Dann die Moderatorvariable (Skala) mit der unabhängigen Variable (Skala) multiplizieren und diese neue Variable als Moderatorterm ins Modell mit aufnehmen.

  30. Hallo Herr Riepl,
    Vielen Dank für die Erklärung.
    Ich habe bei meiner Bachelorarbeit die Interaktionen einmal mit den standardisierten Werten gemacht und einmal ohne, diese Interaktionen sehen aber teilweise nicht ähnlich aus. Kann das sein oder müsste der Moderatoreffekt (also die beiden Linien) ungefähr gleich aussehen?
    Außerdem kreuzen die Linien sich jetzt über der X-Achse da sie ja standardisiert sind, das sieht zwar nicht schön aus, ist aber nicht zu ändern oder? Die X-Achse sollte schon bei null bleiben denke ich?
    Vielen Dank im Voraus und Viele Grüße
    Viki

    1. Hallo Viki,
      ja, es ist normal, dass Interaktionen mit standardisierten Werten ein wenig anders aussehen. Immerhin werden dabei ja Effekte unterschiedlich großer Skalen ausgeglichen.
      Ich denke es ist nicht störend, wo die Linien sich kreuzen. Wichtig wäre mir vor allem zu zeigen, dass die Linien nicht parallel verlaufen – das ist das wesentliche Kennzeichen des Interaktionseffekts.
      Viele Grüße,
      Wolf

  31. Lieber Herr Riepl,

    vielen Dank für die tolle und anschauliche Erklärung! Ich hätte mal eine Frage zur Moderation innerhalb von Varianzanalysen: Ich möchte eine Moderation rechnen, allerdings ist mein Moderator metrisch. Muss ich diesen Moderator dummy-codieren, um ihn in die Varianzanalyse einfließen zu lassen oder gibt es da auch einen anderen Weg (da die Variable 5 stufig ist, wird die Interpretation des Moderators als Dummy nämlich bestimmt alles andere als einfach).

    Besten Dank und viele Grüße
    Anna

    1. Hallo Anna,
      die Herausforderung liegt nicht im Moderator, sondern in der fünfstufigen Variable. Vorschlag: Regression, vier Dummyvariablen für vier Faktorstufen, die fünfte Stufe kommt nicht ins Modell und dient als Referenzkategorie. Jede der vier Stufen kannst Du mit dem metrischen Moderator multiplizieren, um die Interaktionsterme zu erhalten.
      Mehrere Interaktionsterme in einem Modell sind allerdings sehr schwer zu interpretieren. Ich würde separate Modelle mit jeweils nur einem Moderator verwenden. Interpretation eines signifikanten Moderatorterms: Der Effekt der Stufe x im Vergleich zur Referenzkategorie fällt unterschiedlich aus je nach Ausprägung des Moderators.

      1. Hallo Herr Riepl,
        haben Sie tausend Dank für Ihre schnelle und ausführliche Antwort! Entschuldigung, ich hab mich falsch ausgedrückt! Nicht die Variable ist fünfstufig, sondern der Moderator. Meine unabhängige Variable in der Varianzanalyse ist dichotom (zwei Gruppen) und die unabhängige Variable ist metrisch. Der MODERATOR ist fünfstufig (entschuldigen Sie, da hab ich mich wirklich falsch ausgedrückt)! Ich würde also gerne einen Interaktionseffekt aus meiner unabhängigen Variable (dichotom) und dem Moderator (fünfstufig) berechnen – da wäre also die Frage, ob ich den Moderator einfach dummy-codieren (vier Dummyvariablen, eine Referenzkategorie) kann und dann mit ins Modell einfließen lasse?!
        Vielen Dank und Entschuldigung für die missverständliche Beschreibung
        Anna

        1. Hallo Anna,
          ich denke, in dem Fall ist es ähnlich. Ja, dummy-codieren. Ein Modell mit mehreren Interaktionstermen ist auch so schwer zu interpretieren. Stehen die fünf Stufen für eine bestimmte Reihenfolge? Dann könnte man überlegen, bei einer bestimmten Schwelle (Verteilungen beachten, sodass ausreichende Gruppengrößen entstehen; es muss natürlich auch inhaltlich sinnvoll sein) in hoch und niedrig zu unterscheiden. Wenn allel fünf Stufen wichtig sind, würde ich es mit separaten Modellen versuchen.

          1. Das ist eine super Idee! Die fünf Stufen stehen für „stimme überhaupt nicht zu“ bis „stimme voll und ganz zu“! Eine Unterteilung in zwei Stufen könnte ich auf jeden Fall mal ausprobieren! Haben Sie vielen Dank für die Antwort! Ansonsten sind die separaten Modelle wohl wirklich die beste Lösung!
            Beste Grüße und vielen Dank noch mal
            Anna

          2. Hallo Herr Riepl,

            entschuldigen Sie, ich noch mal 😉 Ich habe eine ganz kurze Nachfrage, da ich gerade versuche, Ihren Vorschlag, meine fünfstufige Variable in eine zweistufige Variable umzuformen, umsetzen möchte.
            Dabei ist mir aufgefallen, dass ich nicht nur die Stufen „stimmt nicht zu“ und „stimmt zu“ umcodieren kann, sondern die Ausprägung „3“ noch bedenken muss, die ja „unentschieden“ bedeutet und sich somit weder zur 1 „stimme nicht zu“ noch zur 2 „stimme zu“ zuordnen lässt. Wenn ich nun meine fünfstufige Variable in eine dreistufige Variable, 1 „stimme nicht zu“, 2 „mittel“ und 3 „stimme zu“ umforme, darf ich dann diese Variable noch als Moderator in das Set der unabhängigen Variable in meine Varianzanalyse nehmen? Oder kann ich dann eine Dummy-Codierung dieses dreistufigen Moderators nicht umgehen?

            Haben Sie besten Dank für Ihre Hilfe
            Anna

          3. Ich würde mir die Verteilungen ansehen und dann zwei Gruppen bilden. Z. B. „Stimme zu“ vs. „Unentschieden / stimme nicht zu“.

  32. Hallo Herr Riepl,
    Ich habe eine Frage zur z-Standardisierung eines dichotomen Moderators. Ich habe bereits einiges zur z-Standardisierung gelesen und bin mir jetzt nicht sicher, ob das in meinem Fall sinnvoll wäre oder nicht.
    Konrekt: mein Prädiktor ist Gewissenhaftigkeit (kontinuierlich), mein potentieller Moderator ist Arbeitslosigkeit (dichotom) und das Kriterium ist Lebenszufriedenheit (kontinuierlich). In meiner Statistik Vorlesung habe ich gelernt, dass man Prädiktor und Moderator am besten z-standardisiert. Wie ich in einem Buch (Hayes : Introduction to Mediation, Moderation and Conditional Process Analysis) gelesen habe, ändert eine z-Standardisierung nichts am Ergebnis für den Interaktionsterm, sondern es geht dabei vielmehr um die Interpretierbarkeit der Moderation. Jetzt habe ich Bedenken, dass eine z-Standardisierung von Arbeitslosigkeit dazu führt, dass ich das ganze weniger gut interpretieren kann, daher würde ich eher nicht standardisieren.
    Wie ist Ihre Meinung denn dazu?
    Liebe Grüße,
    Christine

    1. Hallo Christine,
      bei dichotomen Merkmalen halte ich eine z-Standardisierung nicht für sinnvoll.
      Viele Grüße & viel Erfolg!
      Wolf Riepl

  33. Hallo, ich hoffe hier ist noch wer aktiv…
    ich untersuche zZ den Zusammenhang von versch. Lerngelegenheiten(UV) mit dem daraus folgenden Wissenscore (AV, intervallskaliert). Dabei werden Kontrollmerkmale eingebracht (Berufswunsch ja/nein; absolvierte Ausbildung ja/nein; Intelligenz intervallskaliert). Ein positiver Einfluss von Anzahl der Lerngelegenheiten auf Wissen wird erwartet. Nun könnte ich doch einfach eine Regression berechnen und die 3 Merkmale zur Kontrolle mit einbringen.
    Hintergrund: Ich benötige min. 3 Hypothesen (max 5). Da ich nur 2 versch Lerngelegenheiten a und b habe kann ich ja nur 2 Hypothesen aufstellen.
    Var1 (nicht ausreichend)
    H1 Anzahl LGa wirkt positiv auf Wissen
    H2 Anzahl LG2 wirkt positiv auf Wissen
    jeweils unter Hinzunahme der 3 Kontrollvariablen.

    Nun bekam ich den Tip das mit Mediatoreffekten zu machen, weil ich so mehr Hypothesen aufstellen könne(?).
    Aktuelle Studien konnten zeigen dass Intelligenz in diesem Fall nicht so sehr wirkt, so könnt ich das begründet weg lassen.
    Außerdem hat die Ausbildung wohl den größten Effekt weshalb ich bei LGb auch nur diese mit einbeziehen würde.

    Var2 (machbar?)
    H1.1 Anzahl LGa wirkt positiv auf Wissen (normale Regression)
    H1.2 Anzahl LGa*Berufswunsch wirkt positiv auf Wissen (Moderatoreffekt)
    H1.3 Anzahl LGa*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    H2.1 Anzahl LGb wirkt positiv auf Wissen (normale Regression)
    H2.2 Anzahl LGb*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)

    Das ganze auf 30 Seiten Bachelorarbeit.
    Wie seht ihr das?

    1. Hallo Dirk,

      meinst Du Moderator- oder Mediator-Effekt? Das sind unterschiedliche Modelle und unterschiedliche Hypothesen. Oben steht Mediator, unten Moderator. Die Hypothesen passen zu Moderator-Effekten.
      Ja, hört sich gut an.

      Formulierungsvorschlag:
      Anzahl LG (gilt für a und/oder b) wirkt unterschiedlich auf Wissen je nach Ausbildung bzw. Berufswunsch.

      Viel Erfolg!

      Wolf

  34. Lieber Wolf,

    besten Dank für die einfache und gut erklärte Darstellung der Moderationseffekte! Ich hatte in der Tat anfangs gar keinen Plan gehabt, wie ich die Interaktionen richtig interpretieren soll! Toll gemacht!

    LG aus NRW,

    Tati

  35. Hallo Wolf,

    danke für dein aufschlussreiches Video. Ich hätte eine Frage zu einem Untersuchungsdesign, das etwas komplizierter ist.

    Ich habe zwei intervallskalierte UV (zB: Intelligenz und Arroganz) und eine Gruppenvariable mit Gruppen (zB. Unter-, Mittel- und Oberschicht). Meine AV wäre intervallskaliert (zB. Anzahl Fotos Instagram).

    Erhalte ich nun einen, zwei oder drei Interaktionsterme und wie interpretiere ich das Ergebnis?

    Vielen Danke für deine Hilfe.

    Patrick

    1. Hallo Patrick,
      das ist in der Tat kompliziert. Hast Du denn Hypothesen zu allen Interaktionen? Ich würde mir die Interaktionen einzeln anschauen, d. h. ein Interaktionsterm pro Modell (sowie die Haupteffekte, d. h. die UVs, die die Interaktion bilden, auch einzeln in das Modell aufnehmen). Wenn Du die Gruppenvariable nicht sehr grob als (quasi-)metrisch auffassen willst, musst Du mit Dummyvariablen arbeiten, d. h. 0/1-Codierung. Ich würde dann eine Gruppe mit allen anderen vergleichen. Z. B. Gruppenvariable Unterschicht, 1=Unterschicht, 0=keine Unterschicht. Gibt es eine Interaktion, dann unterscheidet sich die Steigung der Regressionsgeraden zwischen Unterschicht und „Nicht-Unterschicht“.
      Ich weiß nicht, ob sich ein Gesamtmodell mit mehreren Interaktionstermen sinnvoll interpretieren lässt. Für jeden Term müsste gelten „wenn alle anderen Modellvariablen konstant gehalten werden“.
      Also generell: So einfach wie möglich, so komplex wie nötig. Ich bezweifle, dass es „nötig“ ist, alle Interaktionen in ein Modell zu werfen und dann exakt zu interpretieren …
      Viel Erfolg!

      1. Vielen Dank für die schnelle Antwort. Ich möchte ein großes Modell haben und habe insgesamt 4 Prädiktoren und zwei Interaktionsterme, die unter Berücksichtigung der Literatur sinnvoll wären. Die Prädiktoren und Interaktionsterme würde ich dann gerne hierarchisch aufnehmen.
        Ich glaube, dass ich mir noch mal den Bühner/Ziegler vornehme und mit meinem Prof. berate.
        Danke für die Erklärung.

  36. Hallo,

    ich habe ähnlich wie Deleno einen metrischen Moderator, während der andere UV kategorial ist. AV ist metrisch. Ich habe vor der Analyse metrischen Variablen standardisiert, die kategoriale Variable (3 Stufen) dummycodiert. Ich habe auch die Grafik erstellt, die jedoch gleich ist mit deiner – bei dir fungiert jedoch der kategoriale Prädiktor als Moderator. Ist es falsch, wenn ich gleiche Grafik verwende und sage, dass die metrische Variable der Moderator ist, wobei der auf der x-Achse abgebildet ist?

    Tausend Dank im Voraus!

    Lena

    1. Hallo Lena,
      klingt erst mal vernünftig. Kannst Du das Ergebnis interpretieren, sodass es inhaltlich sinnvoll ist und zur Grafik passt? Dann denke ich passt es.

  37. Hallo,

    vielen Dank für die gute Erklärung!!! Kann es eigentlich Probleme geben, wenn ich einen dichotomen Moderator (0 und 1) habe, wo die Stichprobengröße verschieden ist? Also wenn N = 600 für Ausprägung 0 und N = 2000 für Ausprägung 1 betragen. Oder wird das durch Gewichtung und Z-Standardisierung (der UV, nicht der Dummyvariable) ausgeglichen?

    Lieben Gruß
    Joleena

    1. Hallo Joleena,
      ich verstehe es so: Die Stichprobengröße ist N=(2000+600)=2.600.
      Bei einem dichotomen Merkmal wird man nur in seltenen Fällen eine genaue Gleichverteilung der beiden Ausprägungen erreichen. Prinzipiell und in Deinem Beispiel halte ich das für völlig unproblematisch. Schwierig wird es nur, wenn eine Ausprägung sehr schwach besetzt ist. Z. B. 10 mal die 0 und 2590 mal die 1. Dann wären die Ergebnisse nicht besonders belastbar. Aber bei 600 / 2000 sehe ich da kein Problem.

      Ungleiche Gruppengrößen kann man natürlich durch Gewichtung ausgleichen. Das könnte sinnvoll sein, wenn „in Wirklichkeit“ (in der Grundgesamtheit) die Verteilung des dichotomen Merkmals ausgeglichen ist (50/50). Das muss nicht so sein.

      z-Standardisierung passt hier meines Erachtens nicht. Die ist sinnvoll, wenn man verschiedene Merkmale hat, die auf unterschiedlichen Skalen gemessen wurden, z. B. Alter in Jahren, Länge in Zentimetern usw. Dann hat „eine Einheit“ je nach Merkmal eine ganz unterschiedliche Bedeutung. Ohne Standardisierung können Merkmale mit „großen“ Skalen einen größeren Einfluss auf die Ergebnisse ausüben als Merkmale mit „kleinen“ Skalen.

  38. Hallo,

    kurz eine Frage zum Interaktionseffekt:
    Im Interaktionsterm in der Regression wird nur die Gruppe analysiert, die als UV mit dem Wert 1 kodiert ist oder?
    Also wenn z.B.
    UV=Migration –> 0=kein Migrationshintergrund und 1=Migrationshintergrund
    Moderator= Einkommen (metrisch: hohe Werte= hohes Einkommen)

    Dann wäre die Interpretation des Interaktionseffektes: je reicher ein Migrant desto…

    Kann man irgendwie auch untersuchen, wie sich hohes Einkommen bei Personen ohne Migrationshintergrund auswirken würde?

    Vielen Dank

    1. Hallo Deleno,
      es geht um eine Wechselwirkung. Also nicht: Je reicher, desto, … Sondern: Bei höherem Einkommen wirkt der Migrationshintergrund anders auf die AV als bei niedrigem Einkommen.

      Vielleicht fällt die Interpretation leichter, wenn Du den Migrationshintergrund als Moderator betrachtest? Formulierungsvorschlag: Mit Migrationshintergrund wirkt das Einkommen anders auf die AV als ohne Migrationshintergrund.

      1. Hmm..aber könnte der Interaktionseffekt dann nicht so interpretiert werden:
        Je höher das Einkomen, desto zufriedener sind Migranten? (wenn Einkommen einen positiven Effekt hat)

        1. Versuch es mal einfach:
          Wie ist die Korrelation zwischen Einkommen und Zufriedenheit (das ist wohl die AV) insgesamt?
          Und dann getrennt für Migranten und Nicht-Migranten: Wie ist da jeweils einzeln die Korrelation zwischen Einkommen und Zufriedenheit? Unterscheiden sich die Korrelationskoeffizienten?

  39. Hallo,

    danke erstmal für die gute Erklärung!
    Ich habe eine Frage zu dem Video. Wie würde nun die Regressionsgleichung für das Modell mit dem Interaktionseffekt (03:50 Minuten) aussehen, wenn ich den Lernerfolg voraussagen möchte?
    Bleibt der Term Lernstunden in dem Regressionsmodell, obwohl es nicht signifikant (0.199) ist oder wird der Term entfernt und das Modell erneut berechnet?

    Vielen Dank

    1. Hallo Philipp,
      ich würde die Lernstunden drinlassen. Das Besondere an den Interaktionseffekten ist ja, dass der Effekt der Lernstunden nicht mehr nur in dem Prädiktor Lernstunden steckt, sondern auch zum Teil in dem Interaktionsterm Lernstunden * Entspannungstechnik, der signifikant ist. D. h. diese beiden Terme sind nicht von einander unabhängig; beide „gehören“ zum Modell.
      Viel Erfolg mit Deinen Analysen!
      Wolf

Schreibe eine Antwort zu Stef Antwort abbrechen