Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie abgeleitet, was UV und was Moderator ist) und das Produkt (die Multiplikation) der beiden als sogenannten Interaktionsterm ins Regressionsmodell auf. Erweist sich der Interaktionsterm als signifikant, so liegt ein Moderatoreffekt vor; auf deutsch: die unabhängige Variable wirkt unterschiedlich auf die abhängige Variable ein, je nach Zustand des Moderators.
Update: Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung, mit Video:
Regressionsmodelle visualisieren in R (ggplot2, plotly)
Moderatoreffekte im Video
Die Herausforderung: genaue Interpretation des Moderatoreffektes
So weit, so gut. Die Schwierigkeiten beginnen oft damit, die Vorzeichen und Wirkungsrichtungen zu interpretieren. Der Effekt der unabhängigen Variablen ist nun nicht mehr allein an ihrem Koeffizienten abzulesen, sondern zusätzlich auch im Interaktionsterm enthalten. Was bedeuten die Ergebnisse nun genau?
Hier helfen grafische Darstellungen. Zunächst ein einfaches, konstruiertes Beispiel (ist nicht von mir, ich bin in einem Statistikforum darauf gestoßen). Nicht zur praktischen Nachahmung empfohlen!
Hier wird die Wirkungsweise eines Moderators hoffentlich noch deutlicher. Schüttet sich jemand Benzin (=unabhängige Variable, UV) auf den Arm, so resultiert daraus noch keine Hautverbrennung (=abhängige Variable, AV). Hält er sich jedoch zusätzlich ein Feuerzeug (Moderator) an den Arm, dann – Kawumm. Je nachdem, ob ein Feuerzeug verwendet wird oder nicht, bewirkt das Benzin einen sehr unterschiedlichen Effekt auf die Haut. (Das Feuerzeug allein wird zu einer gewissen Hautverbrennung führen, aber bei weitem nicht so schlimm wie mit Benzin. Man kann die beiden Effekte nicht getrennt von einander betrachten oder einfach addieren.)
Die Grafik zeigt, dass Benzin ohne Feuerzeug praktisch keinen Einfluss hat, mit Feuerzeug dagegen ein sehr starken.
Beispiel 1: Der Moderator verstärkt eine positive Beziehung
Nun gibt es verschiedene Möglichkeiten, wie Moderatoreffekte wirken können. Ein weiteres Beispiel:
Abhängige Variable ist der Lernerfolg; UV: Lernstunden; der Einsatz einer Entspannungstechnik wirkt als Moderator. Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht: die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus. Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik beeinflusst. Mit anderen Worten: Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.
Beispiel 2: Der Moderator schwächt eine positive Beziehung ab
Hier geht es wieder um den Zusammenhang zwischen Lernstunden und Lernerfolg, Moderator ist diesmal jedoch der Alkoholkonsum.
Diesmal schwächt der Moderator die positive Beziehung ab. Auch hier gilt: der Lernerfolg steigt mit steigender Anzahl der Lernstunden. Mit höherem Alkoholkonsum wird der Zusammenhang jedoch schwächer.
Beispiel 3: Der Moderator verstärkt einen negativen Zusammenhang
Im letzten Beispiel wird ein negativer Effekt nachgewiesen, der durch einen Moderator sogar noch verstärkt wird.
Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.
Übrigens: Findet man keinen Moderatoreffekt, so bedeutet das grafisch, dass die beiden Geraden parallel verlaufen. Alle Beispiele sind konstruiert und beruhen nicht auf realen Daten!
Zuletzt natürlich die Preisfrage: Wie macht man das? Am besten in R.
Es gibt praktische Excelvorlagen dazu, in die man nur die Modellkoeffizienten eintragen muss. Sogar die Interpretation ist vorbereitet, allerdings auf Englisch.
Fundstelle: StatWiki, Case Western Reserve University, Cleveland, Ohio [URL leider nicht mehr erreichbar]
Excel-Tool, two-way interactions
Weitere Informationen bei Jeremy Dawson.
Bei der Verwendung der Tools von Jeremy Dawson wird zwischen standardisierten und unstandardisierten Variablen unterschieden; StatWiki setzt standardisierte Variablen voraus (als ich das Tool heruntergeladen habe, stand dort der Hinweis „unstandardisiert“ – meines Erachtens ist das falsch!). Manche Autoren empfehlen Standardisierung (vor Berechnung des Interaktionsterms). Dadurch wird der Einfluss unterschiedlicher Skalierungen der Variablen neutralisiert. Ein typisches Beispiel bilden Geschlecht (zwei Ausprägungen) und Alter (z. B. von 18 bis 65). Nachteil der Standardisierung ist schwierigere Interpretierbarkeit: was bedeutet eine Einheit einer standardisierten Variable?
In beiden Fällen sind die unstandardisierten Regressionskoeffizienten (B, nicht beta) einzutragen. Bei unstandardisierten Variablen müssen zusätzlich Mittelwert und Standardabweichung eingetragen werden; bei z-standardisierten Variablen ist dies nicht notwendig, da der Mittelwert 0 beträgt und die Standardabweichung 1.
Viel Erfolg beim Interpretieren von Moderatoreffekten! Welche Erfahrungen haben Sie damit gemacht? Wenn Ihnen der Artikel weitergeholfen hat – bitte weitersagen!
Für eine ausführlichere Diskussion über die Auswahl der geeigneten statistischen Methode siehe den Beitrag Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?
Literaturtipps (#bezahlte-Links):
Introduction to Mediation, Moderation, and Conditional Process Analysis, Second Edition: A Regression-Based Approach (Methodology in the Social Sciences)
Discovering Statistics Using IBM SPSS
Discovering Statistics Using R
Hallo Herr Riepl,
erstmal vielen Dank für diese hilfreiche Erklärung!
Ich sitze gerade an der Auswertung meiner BA und habe mit dem PROCESS-Makro von Hayes Moderationsanalysen gerechnet. Bei keiner war das Gesamtmodell signifikant. Somit berichte ich nur diese Zeile des Gesamtmodells R² = Varianzaufklärung, F(dfZähler, dfNenner) = F-Wert, p = Signifikanz, oder? Und auf die Interaktion muss ich dann ja nicht eingehen?
Liebe Grüße,
Simon
Hallo Simon,
das würde ich so pauschal nicht sagen. Es kann schon sinnvoll sein, etwas mehr von den Modellen zu berichten.
Bin selbst lange raus aus SPSS und Hayes …
Viele Grüße
Wolf
vielen Dank für deine Antwort!! Ok, dann meinst du, es ist sinnvoll das Gesamtmodell und den Interaktionsterm zu berichten?
LG Simon
Würde ich machen. Natürlich die (nicht) signifikanten p-Werte interpretieren. Generell denke ich, Ergebnisse sind berichtenswert, auch wenn sie nicht signifikant sind. (Ich würde nur nichts behaupten, was das Modell nicht hergibt.) Manchmal sind gerade nicht signifikante Ergebnisse spannend, wenn man z. B. viel eher signifikante Zusammenhänge vermutet hätte.
Hängt natürlich auch vom Betreuer ab – wenn der es lieber ganz knapp haben will oder Du noch viel mehr gerechnet hast, kann es auch sinnvoll sein, es kurz zu halten …
vielen Dank 🙂
Guten Tag Herr Riepl
Ich bin zurzeit an meiner Masterarbeit und rechne dafür eine Moderatoranalyse mit Process. In meinem Modell habe ich eine UV, eine AV und eine Moderatorvariable (alle Variablen sind intervallskaliert).
Ich habe sechs Hypothesen:
1: Je höher die Bildschirmzeit desto länger die Einschlafdauer.
2: Je höher die elterliche Sensitivität desto geringer ist die Einschlafdauer.
3: Je höher die elterliche Sensitivität desto negativer ist der Zusammenhang zwischen Bildschirmzeit und Einschlafdauer
4: Je höher die Bildschirmzeit desto schlechter die Schlafqualität.
5: Je höher die elterliche Sensitivität desto besser ist die Schlafqualität.
6: Je höher die elterliche Sensitivität desto positiver ist der Zusammenhang zwischen Bildschirmzeit und Schlafqualität
Um die Hypothesen zu beantworten habe ich 2 Moderatoranalysen gerechnet. Die Ergebnisse zeigen keine signifikante Effekte beim Gesamtmodell und bei der Interaktion. Meine Frage nun: Um die 4 Haupteffekte zu interpretieren, muss da eine separate Regression ohne M gerechnet werden oder kann ich die Haupteffekte direkt aus den Berechnungen, die mir Process ausgibt, ablesen?
In der Moderatoranalyse sind die Haupteffekte nicht signifikant. Wenn ich jedoch separat eine Regression rechne, habe ich signifikante Zusammenhänge zwischen UV und AV. Ich bin nun unschlüssig, welche Analysen ich für die Haupteffekte interpretieren soll.
Besten Dank für Ihre Hilfe.
Freundliche Grüsse
Adriana
Bei Modellen mit Moderatoreffekt sind die Haupteffekte nicht unabhängig vom Moderatoreffekt zu interpretieren – die UV kommt in beiden Termen vor. Ich würde die Regression ohne Moderator heranziehen für die Haupteffekte.
Guten Tag Herr Riepl
Besten Dank für Ihre Rückmeldung. In diesem Fall ist es korrekt, dass ich eine Moderatoranalyse mit Process rechne und nur die Interaktion interpretiere. Für eine Aussage der Haupteffekte rechne ich dann einfach eine lineare Regression?
Und stimmt es, dass ich bei der Moderatoranalyse im Process für die Interpretation der Haupteffekte nur die Aussage machen könnte, dass wenn z.B. die Moderatorvariable eine mittlere Ausprägung hat (da zentrierte Variable) die UV keinen Einfluss auf die AV hat (wenn Effekt nicht signifikant ist)?
Besten Dank und freundliche Grüsse
Adriana
Ja, für Interpretation der Haupteffekte ohne Berücksichtigung des Moderators würde ich ein Modell ohne Interaktionsterm nehmen. Bei Moderator-Modellen steckt der Einfluss der UV in zwei Termen und kann daher nicht nur aus einem Term interpretiert werden – die beiden Terme beeinflussen sich gegenseitig.
Guten Morgen Herr Riepl,
ich schreibe derzeit meine Bachelor-Thesis und habe eine Moderatoranalyse mit PROCESS durchgeführt. Ich sollte auf Wunsch meines Betreuers vorher z-standardisieren, habe demnach nur die Beta-Gewichte und kein B.
Jetzt ist mir beim Lesen dieses Artikels ein Fehler aufgefallen. Ich habe die Grafik zur Simple Slopes Analyse mit dem Template von Jeremy Dawson erstellt und habe die standardisierten Beta Gewichte angegeben, obwohl die unstandardisierten B’s gefragt waren. Ich habe aber aufgrund der z-standardisierung und Berechnung mit PROCESS aber keine B’s.
Ich bin jetzt etwas überfragt, wie ich die Plots erstellen soll. Nächste Woche ist schon Abgabe…
Liebe Grüße und vielen Dank,
Noa
Hallo Noa,
bin inzwischen ziemlich raus aus dem Thema. Ohne Gewähr: Ich halte die Betas hier für verwendbar. In der Grafik geht es ja um der Verhältnis der Steigungen zu einander und nicht so sehr um die ursprünglichen Einheiten.
Wenn Du magst, kannst Du ja (nur für Dich zur Kontrolle) die Moderatoranalyse ohne z-Standardisierung durchführen, die Bs eintragen und die beiden Grafiken vergleichen.
Sehr geehrter Herr Riepl,
vielen Dank für die aufschlussreiche Erklärung!
Ich stehe allerdings gerade etwas auf dem Schlauch, ich habe in meiner Arbeit eine MANOVA durchgeführt, und zusätzlich zu meinem (signifikanten) Haupteffekt einige signifikante Interaktionseffekte gefunden.
Kann ich diese ebenfalls als Moderatoreffekte bezeichnen, oder ist dies tatsächlich nur bei einer Regression und nicht bei einer Unterschiedshypothese möglich?
Vielen Dank im Voraus!
Freundliche Grüße
Milena
Ich stecke nicht mehr so in der Literatur, aber es gibt ja keinen prinzipiellen Unterschied zwischen (M)ANOVA und Regression – beide beruhen auf dem Allgemeinen bzw. Verallgemeinerten Linearen Modell.
Bei mehreren Interaktionseffekten im gleichen Modell wäre ich vorsichtig, es kann da recht komplexe Wechselwirkungen geben. Ich würde zum Vergleich auch einfachere Modelle mit jeweils nur einer Interaktion betrachten.
Alles klar, vielen herzlichen Dank für die schnelle Antwort!
Hallo Herr Riepl,
ich möchte eine Moderationsanalyse rechnen und wollte im Voraus Ausreißer identifizieren.
Anhand der studentisierten ausgeschlossenen Residuen müssten 3 Personen raus; anhand des Hebelwertes sogar 8.
Nur eine Person fällt sowohl anhand der Residuen als auch des Hebelwertes auf.
Ich habe daraufhin noch Difbeta; Diffit und die Cook Distanz kontrolliert. Demnach müsste keine Person ausgeschlossen werden.
Wie gehe ich mit dieser Lage nun um?
Ich würde mich sehr über eine Antwort freuen.
Lg
Hallo Pavlina,
das ist nicht untypisch: verschiedene statistische Methoden können zu unterschiedlichen Ergebnissen kommen. Da gibt es leider kein einfaches Patentrezept. Mir hilft die Vorstellung: Statistik ist ein Hilfsmittel, um Fragen zu beantworten. D. h. inhaltliche Überlegungen haben Vorrang. Ein einfaches „richtig vs. falsch“ gibt es da leider nicht …
Sehr geehrter Herr Riepl,
vielen Dank für die schnelle Antwort. Mit der inhaltlichen Überlegung konnte ich gut begründen, welche Person ich von der Analyse ausgeschlossen habe. Nun habe ich eine weitere Frage zu meiner Moderationsanalyse, die ich mit Process durchgeführt habe.
Ich untersuche Ekelempfindlichkeit als UV, Autoritarismus als Moderator und Fremdenfeindlichkeit als AV.
Ich konnte keinen signifikanten Haupteffekt von UV auf AV feststellen, dafür aber einen signifikanten Haupteffekt von Moderator auf AV und einen Interaktionseffekt von UVxMOD auf AV.
Ich habe getrennte Hypothesen für die Variablen aufgestellt, also vereinfacht:
1. UV beeinflusst AV
2. Mod-Variable beeinflusst AV
3. Moderation (UVxMOD) beeinflusst AV
Ist es nun zulässig, die Hypothesen anhand der Statistik der Haupteffekte abzulehnen/anzunehmen, wenn es einen signifikanten Interaktionseffekt gibt? Sodass ich Hypothese 1 ablehne, Hypothese 2 und 3 jedoch annehme oder bräuchte man dafür noch separate statistische Verfahren?
Ich freue mich auf Ihre Rückmeldung
LG
Pavlina
Ich würde die Zusammenhänge auch im einfachen Modell ohne Moderator betrachten. Ist ein Moderatorterm im Modell, dann steckt der Effekt der UV und des Moderators zum Teil in der UV- bzw. Moderatorvariable, zum Teil im Interaktionsterm.
Hallo Herr Riebl,
vielen Dank für die super schnelle Antwort! 🙂
Dann muss ich mich noch tiefer mit der Literatur beschäftigen, ich habe nämlich überhaupt keine Idee oder bislang keine Literatur gefunden, die dieses Ergebnis begründen könnte. Weil die Technologieaffinität (TRI) sowohl Förderer als auch Hemmnisse beinhaltet, die sich auf die Nutzungsbereitschaft neuer Technologien auswirkt. Dass es keinen Moderatoreffekt gibt, müsste ja heißen, den Konsumenten sind sowohl Vorteile als auch die Nachteile der neuen Technologie ganz egal?
Habe ich es denn richtig verstanden, dass ein „positiver Moderatoreffekt“ bedeuten würde, dass die Beziehung zwischen x und y durch eine höhere Technologieaffinität, verstärkt werden würde?
Freue mich auf Deine Rückmeldung 🙂
> Dass es keinen Moderatoreffekt gibt, müsste ja heißen, den Konsumenten sind sowohl Vorteile als auch die Nachteile der neuen Technologie ganz egal?
Das wäre eine Vermutung. Es kann auch sein, dass Konsumenten Vor- und Nachteile wahrnehmen und diese sich hier insgesamt in etwa ausgleichen. Oder dass Vor- oder Nachteile zwar überwiegen, sich aber nicht auf den Effekt der UV auf die AV auswirken.
Was die Vorzeichen betrifft („positiver Moderatoreffekt“), würde ich grafisch vorgehen. Es gibt ja mehrere Kombinationsmöglichkeiten: Vorzeichen der UV, des Moderators einzeln, des Moderatoreffekts. Jeder kann pos. oder neg. sein. Es kann ein pos. Effekt verstärkt werden oder ein neg. Effekt verstärkt werden oder jeweils abgeschwächt werden.
Vielen Dank! Die Erklärung hat mich schon um einiges weitergebracht! 🙂 Danke!
Hallo Herr Riepl,
Ich schreibe aktuell meine Masterarbeit und untersuche, wie die Zugehörigkeit zu einer Phase der Verhaltensänderung den Zusammenhang zwischen exekutiven Funktionen und körperlicher Aktivität moderiert. Mein Moderator, also die Stufen der Verhaltensänderung, hat 3 Ausprägungen. Zwischenschritte gibt es dabei nicht, daher macht es hier keinen Sinn den Mittelwert zu berechnen. Wie kann ich dann aber einen signifikanten Moderationseffekt interpretieren? Muss ich dabei auf die Zentrierung verzichten?
Beste Grüße
Fabian
Hallo Fabian,
bei drei Ausprägungen ist die Annahme einer Intervallskala etwas gewagt. Kein Ausschlusskriterium, aber ich würde es diskutieren. Alternative wäre Dummy-Codierung, das ist durchaus üblich, man müsste zwei Ausprägungen zusammenfassen (ich würde mir die Verteilungen / Häufigkeiten dazu gut ansehen). Wenn Sie ein bisschen experimentierfreudig sind, können Sie beide Ansätze vergleichen, auch mit oder ohne Zentrierung.
Vielen Dank für die Rückmeldung!
Nur zum Verständnis, wenn ich zwei der Ausprägungen zusammenfasse kann ich jedoch nicht mehr zwischen den einzelnen Ausprägungen unterscheiden, falls ich signifikante Moderationseffekte erhalte oder?
Nein – wenn man zwei zusammenfasst, werden diese beiden wie eine behandelt. Man kann aber die verbleibenden beiden unterscheiden.
Hallo Herr Riepl,
vielen Dank für den super Überblick hier auf Ihrer Seite!
Ich berechne zurzeit verschiedene Moderationsanalysen für meine Masterarbeit. Dabei habe ich als UV jeweils drei Dummy-Variablen (die eigentlich Variable hat also vier Ausprägungen) mit einbezogen und einen Moderator.
Jetzt ist folgendes Problem aufgetreten: Füge ich den Moderator hinzu, ändern sich die Vorzeichen meiner Haupteffekte (bzw. konditionalen Effekte). In der Analyse der Haupteffekte war z.B. das Vorzeichen der Dummy-UV1 positiv und in der Moderationsanalyse ist es nun negativ. Dadurch würde sich ja auch die Interpretation ändern. Eine ANOVA habe ich ebenfalls schon davor berechnet, die zeigte dieselben Effekte mit denselben Vorzeichen an wie in der Analyse der Haupteffekte. Jedoch bekomme ich dann in der Moderationsanalyse signifikante Interaktionsterme. Haben Sie eine Idee, warum das passiert bzw. wie ich das nun interpretieren soll?
Vielen Dank schon einmal im Voraus!
Liebe Grüße
Annika
Hallo Annika,
das ist tatsächlich eine Herausforderung in der Moderationsanalyse. Sobald die Interaktionsterme dazu kommen, sind die Haupteffekte nicht mehr unabhängig interpretierbar. Ein Teil des Effekts steckt im Haupteffekt-Term, ein Teil im Moderationsterm; es gibt Wechselwirkungen. Daher würde ich die Vorzeichen nicht mehr einzeln interpretieren. Grafisch finde ich es einfacher.
Hallo Herr Riepl,
vielen Dank für Ihre schnelle Antwort!
Wie meinen Sie das, die Vorzeichen nicht mehr einzeln interpretieren? Also kann ich z.B. nicht sagen, dass UV auf AV nun einen negativen Zusammenhang darstellt (in der Analyse der Haupteffekte war dies zuvor positiv). Und dieser Zusammenhang verringert sich durch die Moderatorvariable (negativer Koeffizient)?
Grafisch kann ich es mit dem Pick-a-Point-Ansatz schlecht darstellen, da meine UV ja eine Dummy-Variable ist. Wenn ich jedoch den konditionalen Effekt plotte (also y-Achse = UV und x-Achse = Moderator), dann zeigt sich eine klare negative Steigung.
Sie können Beispielrechnungen machen, um ein klareres Bild zu erhalten. Mehrere ausgewählte Werte für den Moderator vorgeben und jeweils die UV mit beiden Ausprägungen; dafür die entsprechenden Modellvorhersagen für die AV berechnen, per Programm oder selbst anhand der Modellformel.
Und ja, ich würde nicht mehr sagen, dass die UV einen negativen Effekt auf die AV ausübt nur anhand des Vorzeichens der UV. Ein Teil des Effekts der UV steckt nun im Moderator.
Vielen Dank für den Tipp!
Ich habe jetzt verschiedene Werte für den Moderator vorgegeben und die Vorhersagen dann berechnet. Dabei kam heraus, dass bei mittlerer bis hoher Ausprägung des Moderators der konditionale Effekt positiv bleibt, jedoch bei einer niedrigen Ausprägung negativ wird. Beziehe ich dann noch den Interaktionsterm mit ein? Oder ist das dann mein Ergebnis: Die UV hat bei mittlerer bis hoher Ausprägung des Moderators einen positiven Effekt auf die AV. Bei niedriger Ausprägung hat sie einen negativen Effekt auf die AV.
Wenn ich Sie richtig verstehe, bezieht sich die Interpretation auf die vorhergesagten Werte und nicht auf die Modellkoeffizienten und deren Vorzeichen. Dann ist der Interaktionsterm über die Modellformel bereits berücksichtigt.
Hallo Herr Riepl,
Ich schreibe zur Zeit meine BA-Thesis und untersuche die Wirkung von Arbeitgeberauszeichnungen auf die organisationale Attraktivität sowie den Moderationseffekt vom Selbstwert in diesem Zusammenhang.
Bedingung (auszeichnung vs. keine Auszeichnung) = β = .11, t(554)= 3.91, p < .001
Selbstwertgefühl = β = -.09, t(554)= -2.28, p = .023
Interaktion (Selbstwert * Bedingung) = β = .06, t(554)= 1.63, p = .104
Es wurde einen signifikanter Haupteffekt der Bedingung auf die Attraktivität gefunden (β = .11, t(554)= 3.91, p < .001).
Die Ergebnisse zeigen, dass das Selbstwertgefühl als Prädiktor für die organisationale Attraktivität signifikant zum Modell beitrug (β = -.09, t(554)= -2.28, p = .023). Außerdem deuten die Ergebnisse darauf hin, dass es für die Interaktion zwischen Selbstwertgefühl und Bedingung keinen signifikanten Moderationseffekt gibt (β = .06, t(554)= 1.63, p = .104).
Ich bin etwas ratlos, wie ich begründen soll, warum der Interaktionsterm nicht signifikant ist, wenn beide Haupteffekte signifikant sind. Deswegen wollte ich Sie fragen, ob Sie hier einen Ansatzpunkt haben.
Lieben Gruß,
Katharina
Hallo Katharina,
die Effekte der Bedingung und des Selbstwertgefühls sind offenbar (weitgehend) unabhängig von einander, d. h. der Effekt der Bedingung hängt nicht vom Selbstwertgefühl ab, bzw. der Effekt des Selbstwertgefühls hängt nicht von der Bedingung ab. Es gibt keine Wechselwirkung.
Vielen Dank für Ihre schnelle Hilfe! Das hat mir sehr geholfen.
Ich hätte noch ein Frage, die allerdings weniger etwas mit Moderationseffekten zu tun hat, sondern mehr mit der Wissenschaftlichkeit von Arbeiten. Eventuell können Sie mir hier auch weiterhelfen.
Ich habe in meine BA meine AV als organisationale Attraktivität festgelegt (OAS). Und bei meiner Datenanalyse liegt mein Schwerpunkt auf dem Regressionsmodell bei dem das Kriterium also die AV auch die OAS darstellt.
Für mich wäre es allerdings noch interessant zusätzlich eine weitere Regressionsanalyse durchzuführen, bei der das Kriterium nicht die OAS ist, sondern ein anderes Maß des Rekruitingserfolges – dem Person-Organisation Fit.
Dieses Maß (PO-Fit) habe ich in der anderen Regressionsanalyse schon als Kontrollvariable mit eingebaut und würde jetzt einfach bei der neuen Regressionsanalyse den PO-Fit als Kriterium verwenden und die OAS als Kontrollvariable.
Jetzt ist meine Frage, ob ich die Ergebnisse dieser zusätzlichen Regressionsanalyse (trotz anderer AV) mit in meine Ergebnisse und Diskussion einbauen darf, wenn ich im Methodenteil vorher nur die OAS als meine AV festgelegt habe.
Wenn Sie dafür keine Antwort wissen, kann ich das verstehen.
Besten Dank
Katharina
Hm … da gibt es mehrere Aspekte. Zum einen gibt es nach meinem Wissenschaftsverständnis in solchen Fragen eher kein generelles „verboten“ oder „erlaubt“. Es kommt auf schlüssige Argumentation an; das lässt sich nicht so pauschal entscheiden. Wenn Sie begründen, warum es für Ihre Fragestellung sinnvoll ist, warum nicht.
Aus statistischer Sicht ist zu beachten, dass es bei Querschnittsdaten (zum gleichen Zeitpunkt erhoben) nicht möglich ist, eine Wirkungsrichtung zu „beweisen“. Wenn PO-Fit auf OAS wirkt, dann wird auch OAS auf PO-Fit wirken. Die Regressionskoeffizienten ändern sich zwar, wenn sich die Einheiten ändern, aber der Zusammenhang an sich besteht in beide Richtungen. Bei der Korrelation ist es klarer, die ist offensichtlich symmetrisch: Wenn OAS mit PO-Fit korreliert, dann korreliert zwangsläufig auch PO-Fit mit OAS. Die Regression ist sehr eng mit der Korrelation verwandt, hier gilt das prinzipiell auch, obwohl die Ergebnisdarstellung etwas anders aussieht.
Unterschiedliche Ergebnisse können Sie erhalten, wenn die Kontrollvariablen zwischen den Modellen variieren.
Lieber Herr Riepl,
im Rahmen meiner Abschlussarbeit wollte ich überprüfen, ob sich die Social Media Nutzung positiv (moderierend) auf die (negative) Wirkungsbeziehung zwischen der Angst, etwas zu verpassen und die Lebenszufriedenheit auswirkt. Ist eine Moderationsanalyse da das richtige? Und wie interpretiere ich das Ganze am besten? Folgende Werte kamen unter anderem raus:
uV: -1,436 (sig)
Mod: 0,462 (nicht sig)
Interaktion: -0,484 (sig)
Mein Dozent meinte, ich läge richtig bei meiner Annahme, dass ein Interaktionseffekt besteht und dass ich schreiben soll, dass sich die Social Media Nutzung nicht direkt, aber indirekt durch die Interaktion mit der uV auf die aV auswirkt. Aber ist das die richtige Interpretation? Zumal mich ja auch die Wirkungsrichtung interessiert. Dazu habe ich die von Ihnen verlinkte Excel Datei heruntergeladen und mir das Ganze grafisch anzeigen lassen. Demnach wäre die Aussage, dass der Moderator die negative Wirkung der Angst, etwas zu verpassen auf die Lebenszufriedenheit zusätzliche negativ verstärkt. Sind solche Aussagen bei einer Moderationsanalyse gerechtfertigt?
Ich hoffe, Sie können mir helfen!
Alles Liebe
Anela
Hallo Anela,
Ihre Interpretation halte ich für plausibel. Der signifikante Interaktionsterm spricht für eine Moderatorwirkung und die Grafik zeigt Ihnen die Richtung des Effekts.
Vorsichtig wäre ich nur bei der Aussage, dass der Moderator (Social Media Nutzung) direkt keinen Effekt hat. Der Effekt steckt zum Teil im Interaktionsterm, der Moderatorterm ist nicht unabhängig interpretierbar. Zur Kontrolle würde ich ein Modell mit UV und Moderator bzw. nur mit Moderator einzeln, aber ohne Interaktionsterm rechnen. Wenn dort der Moderator ebenfalls nicht sig. ist, stimme ich zu. Es ist auch denkbar, dass der Moderator (Social Media Nutzung) einzeln betrachtet einen Effekt auf die Lebenszufriedenheit hat.
Vielen Dank für Ihre schnelle Antwort, das hat mir wirklich sehr weitergeholfen!
Eine Frage hätte ich allerdings noch: Ich habe bisher in meiner Arbeit stehen, dass ich die Ergebnisse der Moderationsanalyse per Simple Slope Analyse grafisch habe darstellen lassen, um die „Beschaffenheit“ bzw. Richtung des Einflusses des Moderators besser nachvollziehen zu können. Kann man das Tool von Stat Wiki denn überhaupt als „Simple Slopes Analyse“ betiteln? Es erschien mir tatsächlich leichter nachzuvollziehen als das von Jeremy Dawson mit den ganzen zusätzlichen Angaben was Mittelwerte, Standardabweichung etc. angeht. Zumal bei der Eingabe auch auf einmal nichts mehr zu erkennen war und die Linien aus dem Sichtbereich gerutscht sind. (Wobei ich auch zugeben muss, dass ich mir nicht sicher war, welches die richtigen Angaben zu meinen Daten sind – ich bin wohl schon zu gestresst um noch klar zu denken).
Darüber hinaus habe ich gelesen, dass man anhand einer Simple Slopes Analyse die Richtung des Einflusses gar nicht ablesen könne, stimmt das? Und wenn ja, welche Wege gäbe es diesbezüglich denn noch?
Vielen Dank schon einmal für Ihre Zeit!
Alles Liebe,
Anela
Habe lange keine solchen Analysen mehr gemacht. Nach meinem Verständnis untersucht Simple Slopes die Beziehung zwischen Prädiktor und Kriterium für verschiedene Werte des Moderators. Dann kann man die unterschiedlichen Steigungen schon vergleichen. (Simple Slopes nur sinnvoll, wenn Interaktion sig. – daher müssten die Steigungen sich unterscheiden.)
Lieber Herr Riepl,
im Rahmen meiner Masterarbeit führe ich eine mixed model Analyse (gemischte Modelle – Regression) durch. Dazu untersuche ich die UV (weiblich geframter Zeitungsartikel vs. männlich geframter Zeitungsartikel – Dummy) auf die AV (wahrgenommene Stereotypität – metrisch).
Dazu untersuche ich, ob die Geschlechterrolleneinstellung (1 = modern bis 5 = traditionell – 5.stufige Likert-Skala) ein Moderator (Variablenname: Geschlechterrolle_Bedingungweiblich) darstellt.
Der SPSS Output sieht folgendermaßen aus:
Schätzungen fester Parameter
Parameter Schätzer Std.-Fehler df T Sig. 95% Konfidenzintervall
Konstanter Term 3,925306 ,343187 3,718 11,438 ,000 2,943265 4,907348
Bedingung_weiblich -,959654 ,259586 1089,026 -3,697 ,000 -1,468999 -,450309
Geschlechterrolle_Bedingungweiblich-,35061 ,15250 1089,028 -2,299 ,022 -,649845 -,051391
Geschlechterrollen_Einstellung -,109579 ,110296 1089,013 -,993 ,321 -,325996 ,106838
a Abhängige Variable: AV 1.
Bedeutet also, dass Der Zusammenhang zwischen der Stimulus-Art (weiblich oder männlich geframt) und der wahrgenommenen Stereotypität je nach Geschlechterrolleneinstellung variiert (p = .022). Richtig?
Nun weiß ich aber nocht genau, wie ich dies interpretiere und berichte. Ich wäre Ihnen sehr dankbar über Ihre Hilfe!
Mir fehlt ein Satz à la „Je moderner die Geschlechterrolleneinstellung desto stärker wird die Stereotypität wahrgenommen..“.
Vielen Dank!
> Bedeutet also, dass Der Zusammenhang zwischen der Stimulus-Art (weiblich oder männlich geframt) und der wahrgenommenen Stereotypität je nach Geschlechterrolleneinstellung variiert (p = .022). Richtig?
Sehe ich auch so.
Eine genauere Interpretation fällt mir anhand der Zahlen auch schwer. Grafisch ist es einfacher. Vielleicht kann man es umdrehen, da die Stimulus-Art bereits in zwei Gruppen vorliegt, die Einstellung jedoch feiner abgestuft ist, etwa so:
Bei weiblichem Framing wirkt die Einstellung stärker negativ (inhaltlich prüfen, hier nur als Formulierungsvorschlag!) als bei männlichem Framing.
Hallo Herr Riepl,
ich habe im Rahmen meiner Bachelorarbeit eine Regressionsanalyse mit 4 unabhängigen Variablen durchgeführt. Eine der 4 Variablen ist signifikant, 3 Variablen sind nicht signifikant. Im nächsten Schritt möchte ich die Variablen auf mögliche Moderatoreneffekte von demographischen Daten (Alter, Geschlecht etc.) testen. Sollte ich nur die signifikante Variable auf Moderatoreneffekte prüfen oder auch die nicht signifikanten?
Vielen Dank!
Auch bei einzeln nicht signifikanten Variablen können Interaktionseffekte auftreten.
Das heißt aber nicht, dass man alles testen muss, was irgendwie möglich ist. Testen Sie das, was Sie sinnvoll und interessant finden.
Vielen Dank für die schnelle Antwort!
Können Sie mir sagen, wie ein signifikanter Moderatoreneffekt bei einer nicht signifikanten Variable erklärt werden kann?
Stellen Sie es sich grafisch vor:
Die unabhängige Variable auf der x-Achse, die abhängige auf der y-Achse. Ohne Moderator sehen wir eine (fast) horizontale Linie. Y ändert sich nicht (oder kaum), wenn x sich ändert.
Nun kommt ein Moderator ins Spiel, sagen wir Geschlecht. Wir können nun zwei Geraden einzeichnen: eine für Damen, eine für Herren. Und nun sehen wir unterschiedliche Steigungen: eine positive, eine negative. Insgesamt gleichen sich die Effekte so aus, dass ohne Berücksichtigung des Moderators die Signifikanzschwelle nicht erreicht wird. Ein signifikanter Moderatoreffekt bedeutet, dass die Steigungen sich statistisch unterscheiden. Das geht auch bei einer Horizontalen als Ausgangspunkt.
Ein ähnliches Konzept ist die verdeckte Korrelation, das Gegenstück zur Scheinkorrelation. Es gibt einen Zusammenhang zwischen x und y – wir können ihn jedoch nur sehen, wenn wir den Moderator berücksichtigen. (Ein einfacheres Modell ohne Moderator wäre: getrennte Analysen für die beiden Moderator-Gruppen, in unserem Beispiel separate Analysen für Damen und Herren.)
Hoffe das hilft!
Guten Tag Herr Riepl,
ich untersuche in meiner Seminararbeit mittels einer Moderationsanalyse den Einfluss von zwei verschiedenen Moderationsvariablen auf den gleichen Zusammenhang. Ich möchte im Anschluss überprüfen, welche der beiden Moderationsvariablen den größeren Einfluss auf den Zusammenhang von X auf Y hat. Gibt es hierfür ein statistisches Verfahren, das angewendet werden kann oder reicht es lediglich Delta R2 der beiden Moderatoren zu betrachten?
Vielen Dank und viele Grüße.
Pavlina
Hallo Pavlina,
ich würde zwei separate Modelle aufstellen mit nur jeweils einem Moderator, weil sonst die Interpretation der Wechselwirkungen recht kompliziert wird.
R² der beiden Modelle zu vergleichen klingt sinnvoll. Wenn Sie die Koeffizienten vergleichen wollen, sind ggf. unterschiedliche Skalen zu berücksichtigen – falls das so ist, kann Standardisierung Abhilfe schaffen. Auch die p-Werte kann man vergleichen. Grafische Darstellung der beiden Modelle kann die Interpretation unterstützen.
Hier ein anspruchsvolles Paper zum Thema:
https://www.frontiersin.org/articles/10.3389/fpsyg.2012.00231/full
Guten Tag Herr Riepl, vielen Dank für diese hilfreiche Seite. Ich habe eine kurze Frage und hoffe, dass Sie mir helfen können. In meiner Moderation geht es um Emotionserkennung als UV (nicht als Moderator). Es wird die Performance in Emotionserkennung gemessen mit 0 (falsch) und 1 (richtig) und summiert. Nun bin ich unsicher wegen dem Skalenniveau. Das ist doch keine Nominalskala oder? Herzlichen Dank für Ihre Antwort!
Das ist ein klassischer Fall, über den man viel diskutieren kann. Solche Dummyvariablen sind in Regressionsmodellen wie metrische Prädiktoren verwendbar. Streng genommen würde ich das als Nominalskala betrachten. Selbst ordinal könnte man argumentieren. Die Einstufung finde ich sekundär, solange die Interpretation passt.
Guten Tag Herr Riepl
Super Videos! Ich habe jedoch folgendes Problem und weiss nicht genau wass ich jetzt machen soll.
Ich habe die unabhängige Variable (1=Produkt manipuliert und 2= Produkt nicht manipuliert) und die abhängige Variable (1= silbriges Produkt und 2 = schwarzes Produkt). Ferner habe ich 4 moderierende Variablen aus der theorie abgeleitet (Alter, geschlecht, Einkommen und Bildung) sowie 5 kontrollvariablen (Verlustaversion, Need for cognition, Erfahrung im Internet und Produktqualität).
Mein Vorgehen–> ich will zunächst einen Haupteffekt zwischen der uV und der aV nachweisen und mache dafür einen Chi-Quadrat-test. Dieser ist jedoch nicht signifikant. Was mache ich nun? wenn der Haupteffekt nicht signifikant ist macht es ja kein Sinn die moderatoren weiter zu berechnen oder? Was ist Ihre Meinung?
Als nächster Schritt wollte ich die signifikants der Moderatoren mit der binären logistisch regression berechnen.
Liebe Grüsse
Jasmin
Hallo Jasmin,
logistische Regression ist schon mal gut bei dieser abhängigen Variable. Ich würde 0/1 codieren, das macht es klarer.
Wenn ein Zusammenhang bivariat nicht signifikant ist (Haupteffekt, Chi-Quadrat), kann es sein, dass er von anderen Variablen verdeckt wird, d. h. es kann sein, dass unter Berücksichtigung von einer oder mehreren Kontrollvariablen doch ein signifikanter Zusammenhang auftritt. (Das ist das Pendant zur Scheinkorrelation.) Es kann sich also lohnen, weiterzumachen.
Was die Moderatoren betrifft: Ich würde sie in separaten Modellen überprüfen, nicht mehr als einen im gleichen Modell. Das würde die Interpretation sehr erschweren.
Übrigens ist es bei der logistischen Regression so, dass Wechselwirkungen ohnehin schon in gewissem Maß berücksichtigt werden, auch ohne explizite Aufnahme von Moderatortermen. Das hat damit zu tun, dass die logistische Kurve über den Wertebereich unterschiedliche Steigungen aufweist, im Gegensatz zur Regressionsgerade der linearen Regression. Das heißt: Der Effekt einer Variable hängt ohnehin zum Teil von Ausprägungen anderer Variablen ab – grafisch: wo man sich auf der logistischen Kurve befindet.
Okay also Sie würden mir raten, dass ich trotzdem die logistische Regression berechne obwohl der Haupteffekt nicht signifikant ist. Habe ich das richtig verstanden? Haben Sie dazu eine Quellenangabe welche ich in meiner Arbeit verwenden kann?
Keine spezifische Quellenangabe genau dazu. Man kann auf Scheinkorrelationen und verdeckte Korrelationen verweisen (dazu gibt es sicher genug Literatur). Ich weiß nicht, ob genau dieser Gedanke belegt werden muss. Ich würde abschließend die Ergebnisse diskutieren und einordnen. Entweder bestätigt sich das Ergebnis des Chi-Quadrat-Tests, dann ist es nicht schlimm, oder es zeigt sich ein anderer Befund, dann wird es spannend …
Guten Tag Herr Riepl,
vielen Dank für diese tolle Seite, Ihre Beiträge sind sehr hilfreich. Ich plane eine Moderation im Rahmen meiner Masterarbeit und Ihre Antwort würde mich sehr weiterhelfen. Ich habe fünf Prädiktoren und möchte herausfinden, wie gut sie mein Kriterium voraussagen. Dafür würde ich normalerweise eine multiple Regr. machen. Im Anschluss möchte ich drei von den Prädiktoren nutzen und zwei Moderationen (mit PROCESS) machen. Kann ich das alles in einer einzigen hierarchischen multiplen Regression machen, d.h. schrittweise die Prädiktoren einzeln rein und dann die Interaktionen, alles zusammen? Darf ich dann erst die einzelnen Beiträge der Prädiktoren interpretieren und dann die Interaktionen? Oder würde sie das getrennt machen? Meine zweite Frage betrifft die Moderationshypothesen. Würden Sie immer zuerst den Hauptpfad als einzelne Hypothese aufstellen (z.B. der Zusammenhang zwischen x und y ist positiv) und dann nochmals zusätzlich eine zweite Hypothese dazu über den Einfluss des Moderators (z.B. je tiefer x2, desto höher der Zusammenhang zwischen x und y)? Oder kann ich mir die erste Hypothese (x und y) sparen? Ich hoffe Sie können mir weiterhelfen. Ich bin betr. des richtigen Vorgehens etwas unsicher.
Vielen Dank im Voraus.
Viele Grüße
Dominik
Hallo Dominik,
1) Die Herausforderung bei Moderatoreffekten besteht in den Wechselwirkungen zwischen Interaktionen und Einzelvariablen. Das macht schon bei einem Moderator die Interpretation etwas schwieriger als bei linearen Modellen ohne Interaktion. Von mehreren Interaktionstermen im gleichen Modell rate ich stark ab. (Stichwort Multikollinearität)
2) Ausführlichere Hypothesen finde ich gut. Ich hab am Anfang auch nach dem „einen Modell“ gesucht, das „alles erklärt“. Nach meiner Erfahrung lernt man Zusammenhänge in den Daten besser kennen, wenn man Schritt für Schritt vorgeht, vom Einfachen zum Komplexeren. Also nur x und y testen, dann um Moderator erweitern finde ich gut.
Viel Erfolg
Hallo Herr Riepl,
auch von mir ein großes Dankeschön für den Beitrag.
Ich schreibe derzeit meine Bachelorthesis und habe ebenfalls eine weitere Frage:
Meine UV ist transformationale Führung, meine AV das Wohlbefinden der Mitarbeitenden. Als Moderator ziehe ich das Geschlecht der Mitarbeitenden heran.
Bei meiner Auswertung in R gibt es wie angenommen einen negativen Zusammenhang bei Frauen und einen positiven Zusammenhang bei Männern, allerdings ist das Geschlecht nicht signifikant ( p= .9).
Können Sie mir sagen, ob ich dann trotzdem die Werte der Berechnung berichten muss oder reicht es zu schreiben „Ein Einfluss des Moderators auf den Effekt der UV auf die AV kann auf Grundlage der vorliegenden Daten statistisch nicht belegt werden“. Die erklärte Varianz (R^2) ändert sich übrigens ebenfalls nicht durch Hinzunahme des Geschlechts.
Danke und liebe Grüße
Isabell
Hallo Isabell,
es ist gute Praxis, alle Berechnungen zu dokumentieren. Ich würde auch Kennwerte nicht signifikanter Modelle angeben – und sei es in Klammern, einer Fußnote oder evtl. im Anhang. Auch nicht signifikante Ergebnisse können interessant sein.
Hallo Herr Riepl,
erstmal vielen Dank Ihre ausführlichen Erklärungen. Im Rahmen meiner Masterarbeit muss ich ebenfalls Moderationseffekte aufzeigen und interpretieren. Leider bin auch ich mit meiner Interpretation sehr unsicher und würde mich freuen, wenn Sie mir helfen können.
Folgender Sachverhalt:
1. UV > AV = signifikant (Koeffizient= 0,2768)
2. Moderator > AV = nicht signifikant (Koeffizient = -0,1349)
3.Interaktionswert = nicht signifikant (Koeffizient= 0,4446)
Meine Interpretation würde hier lauten: Dass mein Effekt sich von der UV auf die AV nicht ändert, wenn mein Moderator das Verhältnis beeinflusst. Jedoch weiß nicht, wie ich den reinen Moderatoreffekt interpretieren soll. Reicht wenn ich sage „Der reine Moderatoreffekt ist nicht signifikant und hat einen negativen Effekt?“
Meine Grafik ähnelt Ihrer „Der Moderator verstärkt eine positive Beziehung“ Grafik – obwohl der Moderator negativ und nicht signifikant ist.
Und hat es eine Bedeutung, wenn sich die zwei Geraden in einer Grafik nicht schneiden?
Ich hoffe Sie können mir helfen.
Vielen Dank im Voraus.
Ganz liebe Grüße!
Beim Vorzeichen des Interaktionsterms wäre ich vorsichtig, da der Effekt sich auf UV, Moderator und Interaktionsterm verteilt und daher nicht isoliert zu betrachten ist. Wenn der Moderator-Effekt nicht signifikant ist, würde ich es einfach halten und sagen: Ein Einfluss des Moderators auf den Effekt der UV auf die AV kann anhand der vorliegenden Daten nicht statistisch belegt werden.
Lieber Herr Riepl,
vielen Dank für Ihre Erklärung! Ich habe eine Frage bezüglich meiner Masterarbeit: Ich möchte eine Moderations rechnen. Meine Unabh. Variable ist dichotom (Berlin oder Hamburg) und meine abhängige Variable ist metrisch (Einstellung). Mein Moderator (Vertrauen) ist auch metrisch. Ich überprüfe die Moderation ja mittels eines Interaktionsterms in einer Regression. Vorraussetzung hierfür ist ja die Linearität zwischen X und Y. Meine dichotome Variable und Y sind ja zwangsläufig linear (nur 2 Ausprägungen), aber muss ich auch überprüfen, ob mein Interaktionseffekt (Vertrauen x Berlin/Hamburg), den ich ja als Variable ins Modell mit aufnehme, auch auf Lineariär zu Y (Einstellung) überprüfen muss?
Es wäre klasse, wenn Sie mir helfen könnten. Ich finde leider nichts in der Literatur.
Hallo Sophia,
bei einer dichotomen Variable kann man diskutieren, ob da ein linearer Zusammenhang mit Y auftreten kann. Ich würde mir darüber jedoch keine Sorgen machen, da dichotome Prädiktoren üblich sind.
Dichotome Variablen werden üblicherweise mit 0/1 codiert, d. h. bei einer Ausprägung (je nachdem, Berlin oder Hamburg) ist der Interaktionseffekt: UV * Moderator = 0 * Vertrauen = 0. Soweit auch üblich. Im anderen Fall ist der Interaktionseffekt: 1 * Moderator = 1 * Vertrauen = Vertrauen.
Einen extra „Test“ auf Linearität der Moderation würde ich also nicht machen. Man kann aber grafisch (z. B. Streudiagramm) prüfen, ob ein linearer Zusammenhang zwischen Vertrauen und Einstellung plausibel ist.
Generell sehe ich das Interaktionsmodell nicht als eines, bei dem die Voraussetzungen sehr streng erfüllt sein müssen. In der Regel geht es eher um einen groben Hypothesentest: Unterscheidet sich der Einfluss des Standorts auf die Einstellung in Abhängigkeit vom Vertrauen. (Oder andersrum, das klingt für mich eingängiger: Unterscheidet sich der Einfluss des Vertrauens auf die Einstellung je nach Standort?)
Vielen vielen Dank für die super schnelle Antwort! Das hat mir sehr geholfen, ich konnte alles nachvollziehen!
Einen schönen Abend noch!
Lieber Herr Riepl,
vielen Dank für diesen Beitrag, er ist wirklich sehr hilfreich!
Wie eine Moderation nun grundsätzlich funktioniert, habe ich verstanden.
Bei dem Modell meiner Masterarbeit habe ich nun 5 unabhängige Variablen, die auf eine abhängige Variable wirken. Dabei wird eine der UVs moderiert. Meine Frage: muss ich also bei der Moderation mit SPSS Process die 4 anderen UVs als Kontrollvariablen einfügen?
Vielen Dank und liebe Grüße
Sophie
Hallo Sophie,
das hängt von Ihren Hypothesen ab … Wenn Sie die Effekte dieser vier UVs kontrollieren wollen, ist es sinnvoll, sie einzufügen.
Mir hilft es oft, verschiedene Modelle zu vergleichen, um die Daten besser zu verstehen. Ich sehe Modelle als „Mosaiksteine“. Das finde ich hilfreicher, als nach dem „einen perfekten“ Modell zu suchen, das es oft nicht gibt.
Konkreter: Wenn Ihre UVs korrelieren, evtl. auch mit dem Moderator oder der moderierten UV, dann werden sich Effekte verändern, je nachdem, ob sie die UVs mit drin haben oder nicht. Ich würde mir also auch einfachere Modelle ansehen, z. B. nur mit der einen UV, nur mit dem Moderator, und nur mit den Variablen, die direkt zu Moderation gehören (die eine UV, der Moderator und der Moderatorterm = die Interaktion).
Textbaustein zur Interpretation: Unter Kontrolle von UVx verändert sich der Effekt von UVy auf Y …
Lieber HErr RIepl,
vielen Dank für diesen wertvollen Beitrag, ich bräuchte jedoch noch Ihre Hilfe.
Ich habe mir das Excel Sheet Quadratic two Interaction herunterghalten, da ich den Interaktionseffekt graphisch drastellen möchte. Nun bin ich etwas verunsichert was mit „Independent variable squared“ gemeint ist. Ist das der Wert der unabhängigen Variable im Quadrat?
Ich wäre über eine Rückmeldung sehr dankbar.
Viele Grüße und danke
Johanna
Ich denke ja.
Ich hab ehrlich gesagt lange nicht mehr damit gearbeitet. Bin jetzt mit R zugange.
Vielen Dank für die Schnelle Rückmeldung. Was bedeutet es wenn die beiden Linien sich nicht kreuzen sondern fast parallel steigen?
Kein Interaktionseffekt
Lieber Herr Riepl,
vielen Dank für die ausführliche Darstellung. In meiner Seminararbeit untersuche ich den Zusammenhang zwischen dem Korruptionsniveau und der Steuerhinterziehung in osteuropäischen Schwellenländern. Hierbei liegt der Fokus besonders auf Maßnahmen zur Verringerung der Steuerhinterziehung. Ich habe dabei an einen höheren Lohn der Steuerbeamten oder eine höhere Entdeckungswahrscheinlichkeit gedacht. Das Korruptionsniveau will ich mit einem Fragebogen untersuchen und die Steuerhinterziehung anhand eines Bribery Games.
Die H1(neu) soll dann sein: „Ein höherer Lohn verringert die Steuerhinterziehung. Dieser Effekt wird durch das Korruptionsniveau moderiert“.
Ich wollte zuerst „Eine höhere fixe Vergütung der Steuerbeamten hat einen negativen Einfluss auf das Korruptionsniveau und dadurch auf die Steuerhinterziehung“ als H1 (alt) nehmen, allerdings ist es schwer den Einfluss der Vergütung auf das Korruptionsniveau zu untersuchen, da ich dieses ja nur durch einen Fragebogen erfahre. Da es aber mit der Steuerhinterziehung in einer Beziehung steht, wollte ich das Korruptionsniveau als Moderation mit einbauen (siehe H1 neu).
Halten Sie das für sinnvoll?
Vielen Dank im Voraus.
Liebe Grüße
Paul
Hallo Paul,
ich stecke nicht so im Thema … Ist das Korruptionsniveau nicht eine Makro-Variable (ein Wert pro Land), für die es externe Statistiken geben müsste?
Wenn man annimmt, dass die Daten brauchbar erfasst wurden, müssten beide Hypothesen-Varianten testbar sein. Bei H1 (alt) müsste man wohl den Zusammenhang zwischen Korruptionsniveau und Steuerhinterziehung präzisieren.
Lieber Herr Riepl,
vielen Dank für die gut erklärte Darstellung der Moderation! Ich habe eine Frage zu Beispiel 2 „Der Moderator schwächt eine positive Beziehung ab“. Wie sehen hierfür die Null- und Alternativhypothese aus?
Konkret habe ich folgende Variablen:
– metrische unabhängige Variable
– kategorialer Moderator mit zwei Ausprägungen (0=Kontrollgruppe, 1=Experimentalgruppe)
– metrische abhängige Variable
Meine Vermutung ist, dass die UV und AV positiv zusammenhängen. Wenn die Versuchspersonen jedoch der Experimentalgruppe (1) angehören, dann verringert sich dieser Zusammenhang.
Die Hypothesen für die Interaktion hätte ich deshalb so formuliert:
– H0: ß größer/gleich 0
– H1: ß 0 heißen?
Herzlichen Dank für Ihre Hilfe!
Hallo Lea,
mein Vorschlag für die Hypothesen:
H0 = Nullhypothese bedeutet: Kein Effekt. Wenn es speziell um den Moderator geht, würde ich formulieren:
Der Moderator hat keinen Effekt auf den Zusammenhang zwischen UV und AV. = Es gibt keinen Moderator-Effekt (Der Moderatoreffekt ist nicht sig.). = Der Zusammenhang zwischen UV und AV unterscheidet sich nicht sig. zwischen Kontrollgruppe und Experimentalgruppe.
H1 = Alternativhypothese: Es gibt einen Effekt, hier: einen signifikanten Moderatoreffekt. Die Gruppenzugehörigkeit wirkt sich signifikant auf den Zusammenhang zwischen UV und AV aus.
Was das „Abschwächen“ betrifft, würde ich das aus der Grafik ablesen. Anhand der Vorzeichen ist es auch möglich, aber das finde ich schwierig, da es einige Kombinationsmöglichkeiten gibt.
Lieber Herr Riepl,
vielen Dank für Ihre Antwort!! Das hat mir sehr weitergeholfen, dann werde ich es so machen.
Ich habe noch eine weitere Frage zur Zentrierung der Variablen. Dazu gibt es ja, wie mir scheint, sehr widersprüchliche Meinungen. Ich rechne die Moderatoranalyse mittels Process und kriege dann die Effekte für meinen Faktor A, Faktor B und für die Interaktion. Ich möchte allerdings nicht nur dei Interaktion interpretieren, sondern auch die Haupteffekte. Angenommen, ich zentriere meine kontinuierliche Variable (Faktor B) und lasse meine kategoriale Variable (Faktor A, gleichzeitig Moderator) so wie sie ist. Kann ich dann die Haupteffekte inteprreiteren? Also z. B. sagen:
– Haupteffekt Faktor A: bei einer durchschnittlichen Ausprägung von Faktor B (weil zentriert) gibt es für Faktor A einen signifikanten Effekt
– Haupteffekt Faktor B: wenn Faktor A konstant gehalten wird, gibt es für Faktor B einen signifikanten Effekt
Oder muss ich das anders formulieren bzw. bzgl. der Zentrierung anders vorgehen? Ich hoffe, es ist verständlich, wie ich es meine.
Nochmal ganz herzlichen Dank!!
Das weiß ich leider nicht. Hab das lange nicht gemacht, müsste ich auch testen und Literatur lesen. Tut mir leid …
Kein Problem, dennoch vielen Dank! 🙂
Hallo Her Riepl,
ich schreibe gerade eine Seminararbeit zum Thema Moderation in PROCESS. Eine Frage die ich mir hier stelle. Nachdem wir unseren Datensatz bearbeitet haben und überprüft haben, lassen wir die PROCESS Analyse laufen. Bei dieser Analyse kommt raus das der Interaktionseffekt mit p=.2525 nicht signifikant ist. Des Weiteren ist der Interaktionseffekt mit .0374 sehr gering. In der graphischen Analyse erkennt man eine leicht höhere Steigung der untersten Gerade, sodass die 3 Gerade leicht zusammenlaufen? Kann man dies als Moderationseffekt analysieren, oder sollte man da lieber die Aussage tätigen, dass es keinen erkennbaren Moderationseffekt gibt? Gibt es dazu Quellen? Mit den besten Grüßen
Dass die Geraden perfekt parallel verlaufen und sich somit auch bei großem Wertebereich nicht schneiden, ist eine sehr strenge Forderung, die bei realen Daten kaum zu erfüllen ist. Der statistische Test (p-Wert des Interaktionseffekts) sagt deutlich aus, dass die (sehr schwache) Wechselwirkung nicht signifikant ist. Die Daten können also aus einer Grundgesamtheit stammen, in der es überhaupt keine Wechselwirkung gibt; die schwache Abweichung von der „perfekten“ Parallelität der Geraden ist statistisch nicht von zufälligen Schwankungen zu unterscheiden.
Hallo Wolf,
großes Lob für deine Seite – hat mir bei der Auswertung meiner Masterthesis bereits sehr geholfen.
Leider stehe ich bei einer Moderation gerade auf dem Schlauch.
Folgendes Szenario:
Meine UV Technikbereitschaft hat einen negativen Einfluss auf den Technostress.
Mein Moderator Organisationale Faktoren hat ebenfalls negativen Einfluss auf den Technostress.
Der Interaktionstermin ist jedoch nicht signifikant.
Bis dahin ist noch alles in Ordnung.
Nun habe ich aber festgestellt, dass die organisationalen Faktoren einen positiven Effekt auf die Technikbereitschaft haben und ich frage mich, wie ich dies – gerade aufgrund des nicht signifikanten Interaktionsterms – interpretieren soll.
Freu mich über deine Anmerkungen.
Viele Grüße
Antje
Hallo Antje,
die nicht sig. Interaktion würde ich so interpretieren: Der Einfluss der Technikbereitschaft auf den Technostress ändert sich nicht wesentlich, wenn sich die Organisationalen Faktoren verändern. Anders formuliert: Der Einfluss der Technikbereitschaft auf den Technostress ist von der Ausprägung der Organisationalen Faktoren unabhängig.
Zum weiteren Verständnis der Zusammenhänge empfehle ich folgende Modelle zu vergleichen. AV ist immer Technostress.
1. UV nur Technikbereitschaft
2. UV nur Organisationale Faktoren
3. UVs Technikbereitschaft und Organisationale Faktoren (ohne Interaktionsterm)
Wie verändert sich der Koeffizient einer UV, wenn die andere UV hinzugenommen bzw. ausgeschlossen wird? Die Koeffizienten sollten sich spürbar ändern, da TB und OF zusammenhängen.
Formulierungshilfe zur Interpretation: Unter Kontrolle der OF ändert sich der Einfluss der TB … Bzw. Unter Kontrolle der TB ändert sich der Einfluss der OF …
Denkmodell: Es geht nicht um „das eine richtige Modell“, sondern der Modellvergleich liefert zusätzliche Informationen für die Interpretation, d. h. mehrere Modelle sind hilfreich, um Zusammenhänge zwischen Variablen besser zu verstehen.
Viel Erfolg
Hallo Wolf,
vielen Dank für deine Rückmeldung.
Bei Modell 1 ist der Regressionskoeffizient B -.34, p <.001
Bei Modell 2 ist der Regressionskoeffizient B -.24, p .<001
Bei Modell 3 ist der Regressionskoeffizient bei Technikbereitschaft: -.29, p.<001 und bei den Organisationalen Faktoren: -.17, p <.001
D.h. Unter Kontrolle der OF verringert sich der Einfluss der TB? Bzw. unter Kontrolle der TB ändert sich der Einfluss von OF? Wie kann man dies begründen?
Wenn TB die persönliche Einstellung von Menschen gegenüber modernen Technologien operationailisert und die organisationalen Faktoren die bestehenden Settings (wie der technische Support durch Helpdesks oder die Einbindung von Mitarbeitern bei technischen Neuerungen) – wie macht das Ergebnis dann inhaltlich Sinn?
Etwa so?: Dass ich, auch wenn ich weniger Technikbereitschaft aufweise, durch den Einfluss von organisationalen Faktoren weniger Technostress wahrnehmen kann? Oder interpretiere ich das Ergebnis falsch? Bin mir noch unschlüssig, was ich aus den Ergebnissen der 3 Modelle ziehen kann.
Liebe Grüße
Antje
> D.h. Unter Kontrolle der OF verringert sich der Einfluss der TB? Bzw. unter Kontrolle der TB ändert sich der Einfluss von OF?
Ja. OF und TB korrelieren, dadurch sind ihre Effekte im gemeinsamen Modell etwas schwächer als jeweils einzeln. (Bildlich gesprochen: Die Effekte überschneiden sich etwas.)
Da in Modell 3 beide Effekte sig. bleiben, gilt weiterhin: Sowohl TB als auch OF reduzieren den Technostress.
> Dass ich, auch wenn ich weniger Technikbereitschaft aufweise, durch den Einfluss von organisationalen Faktoren weniger Technostress wahrnehmen kann?
Ich würde es so formulieren:
Unter Konstanthaltung der OF reduziert TB den Technostress.
Analog: Unter Konstanthaltung der TB reduziert OF den Technostress.
Auch wenn sich die TB der Mitarbeiter nicht verändert, hilft eine Verbesserung der OF gegen Technostress.
Analog: Wenn die OF gleich bleiben, aber die Mitarbeiter (z. B. durch eine coole Weiterbildung) zu einer höheren TB kommen, reduziert sich der Technostress.
Klasse – Tausend Dank für die Erläuterungen!
Die haben mir sehr weitergeholfen
Hallo Herr Riepl,
eine kleine Frage:
Ich habe hier in einer Arbeit bei einer hierarchischen Regression eine signifikante Interaktion von Moderator und UV auf AV erhalten. Jedoch war das Ergebnis zuvor nicht signifikant, heisst UV und AV hingen laut meinen Ergebnissen nicht signifikant zusammen. Wenn ich einen Moderationsplot erstelle, wird bei niedrigem Moderator ein leicht negativer Zusammenhang (Gerade ist annähernd flach) der UV und AV ersichtlich. Bei hohem Moderator zeigt sich dann ein recht deutlicher positiver Zusammenhang der UV und AV.
Wie ist dies zu interpretieren, nachdem der negative Zusammenhang bei niedrigem Moderator ja eigentlich nicht signifikant wäre?
Muss ich beim Berichten schreiben, dass es bei niedrigem Moderator einen negativen Zusammenhang gab und bei hohem Moderator einen positiven oder gibt es noch etwas anderes zu beachten? (Hypothese 1 war: UV hängt positiv mit AV zusammen – abgelehnt -, Hypothese 2 war: Moderator schwächt positiven Zusammenhang zwischen UV und AV ab).
Vielen Dank
Céline
Hallo Céline,
haben Sie auch ein Modell mit UV und Moderator-Variable einzeln, d. h. ohne Moderator-Effekt (Interaktionsterm)? Es könnte auch sein, dass der Moderator den Zusammenhang zwischen UV und AV verdeckt. Verdeckte Korrelation ist das Gegenstück zur Scheinkorrelation.
H2 ist meines Erachtens anhand der Ergebnisse abzulehnen. Vorschlag: Es besteht ein Interaktionseffekt (Empfehlung: Sig.test in Modell mit Interaktionsterm), d. h. die Ausprägung der Moderatorvariable beeinflusst den Zusammenhang zwischen UV und AV. Nur bei hoher Ausprägung des Moderators besteht ein sig. positiver Zusammenhang; bei geringer Ausprägung kein Zusammenhang (tendenziell leicht negativ, aber nicht sig.).
Vielen Dank für die Antwort.
Im Modell wurde nach den Kontrollvariablen in einem Schritt die UV hinzugezogen, im nächsten Schritt der Moderator (beides nicht signifikant) und dann wurde die Interaktion ermittelt (signifikant).
H2 wird auf jeden Fall abgelehnt, da die Interaktion in die entgegengesetzte Richtung geht als erwartet. Probleme macht es mir jedoch, dass H2 auf die Annahme von H1 beruhen. Ich müsste berichten, dass die Gerade bei hohem Moderator sich in die entgegengesetzte Richtung gewendet hat (im Vergleich zu niedrigem MOD von negativ zu positiv). Jedoch macht es für mich nicht so viel Sinn dies zu schreiben, wenn der negative Zusammenhang bei niedrigem MOD keine Signifikanz aufweist.
Dies ist meine erste Arbeit, deswegen bin ich sehr verunsichert. Vielleicht berichtet man dies auch so und ich weiss es noch nicht besser, oder aber ich interpretiere die Ergebnisse falsch (bzgl. keine Signifikanz bei niedrigem MOD).
Ich würde das entspannt sehen und möglichst genau die Befunde beschreiben. Es ist ja nicht schlimm, wenn Hypothesen abgelehnt werden: das ist ein völlig legitimes Ergebnis, das Erkenntnisse liefert.
Hinweis: Es gilt als nicht wissenschaftlich, wenn man Hypothesen erst NACH Blick auf die Daten erstellt und dann an denselben Daten testet. Somit könnte man hier vorschlagen / diskutieren, H2 anders zu formulieren. Das müsste dann an NEUEN Daten überprüft werden. Das ist ein übliches Vorgehen, etwa unter dem Stichpunkt „Ausblick auf weitere Forschung“. (Diese Überprüfung müssen Sie natürlich nicht gleich selbst machen, Vorschlagen genügt erst mal …)
Ja, so habe ich das bereits gemacht. Es gab nur noch einmal eine Änderung in den Daten und somit in der Anschauung des Plots. Deswegen war ich mit der Interpretation verunsichert. Wenn Sie mir jedoch mit meiner Erklärung zustimmen, bin ich beruhigt 😀 Vielen Dank für die Hilfe! Freundliche Grüsse
Sehr geehrter Herr Riepl,
vielen Dank für die Seite! Ich habe zwei Fragen zu meiner Analyse:
Meine Moderationsanalyse hat 1 Kriterium und 3 Prädiktoren (2 metrisch und 1 dichotom). Nun wollte ich ursprünglich auch 2 Interaktionen jeweils zwischen dem dichotomen Prädiktor und den beiden anderen in einem Modell rechnen, habe aber in den vorherigen Kommentaren gelesen, dass das nicht empfehlenswert ist. Wenn ich das nun getrennt rechne, geht das mit AV = UV1 + UV2 + UV1*MOD und AV = UV1 + UV2 + UV2*MOD oder muss ich die UV, die nicht im Interaktionsterm enthalten ist, rausgeben und was ist der Unterschied dabei?
Wie ist das zu verstehen, wenn ein Prädiktor zuvor in der Multiplen Regression signifkant war (Moderator nicht signifkant) und durch das Hinzufügen des Interaktionsterms nicht signifikant wird, der Moderator und die Moderation aber auch nicht signifikant sind?
Vielen Dank im Voraus!
LG, Min
Hallo Min,
a) Die UV, die nicht im Interaktionsterm enthalten ist, kann im Modell bleiben. Der Unterschied ist, ob nach dieser Variable „kontrolliert“ wird oder nicht. Das kann schon sinnvoll sein.
b) Effektveränderung durch Hinzufügen eines Interaktionsterms: Eine Interpretation ist, dass es eine schwache Interaktion gibt: zu schwach, um signifikant zu werden, aber stark genug, um einen Teil des Effekts des Prädiktors „aufzusaugen“, sodass dieser auch nicht mehr signifikant ist.
Generell finde ich es hilfreich, diese Modelle als Werkzeuge zu sehen, mit denen man Informationen über Zusammenhänge in den Daten bekommt. Das gelingt nach meiner Erfahrung häufig am besten, wenn man mehrere Modelle vergleicht und betrachtet, wie sich Effekte verändern, wenn Variablen hinzugefügt oder weggelassen werden. D. h. man sucht dann nicht „das eine perfekte Modell“. Bezogen auf a) könnten Sie somit Modelle mit und ohne die nicht am Interaktionsterm beteiligte UV vergleichen. Es ist natürlich immer eine Frage des Aufwands. Es ist in der Regel nicht möglich, alle Eventualitäten und Wechselwirkungen zu testen und zu interpretieren. Man braucht auch ein wenig Pragmatismus, um zu einem Ergebnis zu gelangen, und kann im Hinterkopf behalten, dass sich das Ergebnis ändern kann, wenn weitere Wechselwirkungen bekannt werden. Beispiel: Eine zusätzliche Kontrollvariable könnte eine Scheinkorrelation oder eine verdeckte Korrelation anzeigen.
Hoffe das hilft ein wenig. Viel Erfolg!
Hallo Wolf,
danke für die tolle Seite! Ich schreibe gerade meine Abschlussarbeit und diese beinhaltet ebenfalls eine Regression inkl. Moderation. Dazu hätte ich zwei Fragen, bei denen ich leider nicht alleine weiterkomme:
Die erste Hypothese untersucht nur den Zusammenhang einer UV auf eine AV. Der Koeffizient der UV ist signifikant, das gesamte Modell laut ANOVA (F-Test) aber nicht, da p >.05. Darf ich den Koeffizienten trotzdem interpretieren oder muss ich meine Hypothese (UV hat einen positiven Effekt auf AV) verwerfen, weil das gesamte Modell nicht signifikant ist?
In meiner Moderation ist der Interaktionsterm und die UV nicht signifikant, der Moderator aber schon. Die Hypothese muss ich verwerfen, aber darf ich trotzdem Aussagen über den Moderator treffen?
Vielen vielen Dank schonmal!
Hallo Juliane,
der erste Punkt kommt mir seltsam vor. Wenn es nur eine UV gibt, sollte der p-Wert der UV mit dem p-Wert der Anova für das Gesamtmodell übereinstimmen. Oder hast Du noch Kontrollvariablen drin? Ist das ein „normales“ lineares Regressionsmodell, oder ein anderes Modell?
Unabhängig davon denke ich, die Interpretation ist „sauber“, solange Du die Ergebnisse vollständig berichtest, sodass der Leser sich auch ein Bild machen kann. Dann kann man ja schreiben, was man gefunden hat: sig. Koeffizient im Sinne der Hypothese, allerdings in insgesamt schwachem (nicht sig.) Modell. Diskutieren, woran das liegen könnte. Z. B. gibt es andere Einflüsse auf die AV, die nicht im Modell enthalten sind, etc.
Punkt 2: Der Effekt des Moderators steckt in diesem Modell teilweise in der Moderatorvariable, teilweise im Interaktionsterm. Eine separate Interpretation nur des Moderator-Koeffizienten ist daher mit Vorsicht zu genießen. Es gibt Wechselwirkungen, auch wenn der Interaktionsterm nicht sig. ist. Ich empfehle ein zusätzliches Modell, das nur den Moderator als UV enthält. Dann kannst Du vergleichen und besser interpretieren.
Danke für die super schnelle Antwort!
Ja genau, das war ein lineares Regressionsmodell mit drei Kontrollvariablen und einer UV. Vielen Dank für die ausführlichen Erklärungen, das hilft mir auf jeden Fall weiter!
Hallo Wolf, ich untersuche den Moderatoreffekt einer Produktkategorie (Technik und nicht Technik) von 4 verschiedenen Werbeanzeigen auf die Kaufabsicht. Die abhängige Variable ist ja metrisch (Kaufabsicht) aber unabhängige Variable mit den 4 Anzeigenvarianten ja nominal. Somit kann man hierfür ja keine Regressionsanalyse verwenden. Wie kann man das denn dann Testen?
Hallo Susann,
nominale Variablen kann man in Dummy-Codierung verwenden. Für jede Variante eine Variable à la „Variante 1“ gibt es zwei Ausprägungen: 0 = nein, 1 = ja. In einem Regressionsmodell genügen dann bei 4 Varianten 3 Dummyvariablen. Wenn alle drei den Wert 0 haben, muss es die vierte Variante sein. (Bedingung: Jeder Fall ist genau einer der vier Varianten zugeordnet.)
Für Moderatoreffekte würde ich es so einfach wie möglich halten. Das heißt pro Modell nur einen Moderatoreffekt testen, d. h. eine Dummyvariable verwenden. D. h. jeder Effekt kann nur testen: Variante x ja vs nein. Du bräuchtest dann mehrere Modelle. Wenn Du versuchst, alles in ein Modell zu packen, wird die Interpretation schwierig, da es viele Wechselwirkungen gibt, die sich gegenseitig beeinflussen.
Hallo Herr Riepl,
vielen Dank für diese Seite!
Ich habe auch eine Frage zu einer moderierten Regression.
Alle Variablen sind bei mir intervallskaliert (3 Prädiktoren, 1 Kriterium). Ich rechne 2 Interaktionen zwischen jeweils dem einen Prädiktor (Persönlichkeit) mit den beiden anderen Prädiktoren als Interaktion (2 Moderationen also).
Die Interaktionsterme haben keine signifikanten Regressionsgewichte und der Haupteffekt für Persönlichkeit ist auch nicht signifikant. Die anderen beiden Prädiktoren haben aber signifikante Betagewichte.
Haben Sie Literaturtipps für Gründe nicht-signifikanter Interaktionen? Hab im Internet z.B. etwas zu verringerten Reliabilitäten bei Interaktionen gefunden, aber leider ohne seriösen Quellenangaben.
Vielen Dank!
Pauline Schmidt
Hallo Frau Schmidt,
zwei Anmerkungen:
1. Ich rate davon ab, mehr als eine Interaktion im gleichen Modell zu verwenden (bin nicht sicher, ob Sie das getan haben). Die Wechselwirkungen bei mehreren Interaktionen im gleichen Modell werden sehr schwer überschaubar. Empfehlung: Separate Modelle mit jeweils einem Interaktionsterm.
2. Das würde ich ganz simpel halten: Nicht signifikante Interaktion bedeutet: kein Hinweis auf eine Wechselwirkung. D. h. der Effekt des Prädiktors ist stabil, er hängt nicht von der Ausprägung des Moderators ab.
Viel Erfolg & viele Grüße
Wolf
Hallo! Super Seite!
Hätte eine Frage zu meiner moderierten Regression.
Meine AV ist die Resilienzskala (metrisch), meine UV ist Alkoholabhängige und nicht Alkoholabhängige (dummy kodiert) und der Moderator Zufriedenheit mit sozialen Kontakten (metrisch).
Der Interaktionskoeffizient ist negativ (-0.9) und die anderen UV sind positiv. (alle sind sig.)
Ich habe Schwierigkeiten das Ergebnis zu interpretieren und darzustellen.
Vielleicht hast du ja eine Idee.
LG
Hallo,
ich finde es auch schwierig, nur nach den Vorzeichen zu gehen. Empfehle unbedingt grafische Darstellung, das macht es wesentlich einfacher.
Hallo Wolf,
ich habe eine multivariate Regression berechnet und möchte nun den Moderatoreffekt prüfen. Ich habe allerdings zwei positive Haupteffekte die auch beide Signifikant sind und dann einen negativen Interaktionseffekt herausgebkommen. Probleme habe ich jetzt bei der inhaltlichen Interpretation, vielleicht können sie mir dabei ja helfen.
Meine Unabhängigen Variablen sind hierbei
1. Hochschulreifen (0/1 skalierung)
2. Nettoeinkommen (in 1000 Euro, mittelwertzentriert)
Haupteffekt Hoschulreife: b=0,285 (p<0,000)
Haupteffekt Nettoeinkommen (zentriert): b=0,259 (p<0,000)
Interaktionseffekt: b=-0,134 (0,000)
Untersucht werden soll die Moderatorwirkung von hoher Schuldbildung auf die Beziehung zwischen Nettoeinkommen und der allgemeinen Lebenszufriedenheit (= Abhängige Variable, 11er Ratingskala 0: ganz zufrieden.. 10:ganz unzufrieden).
Ich währe ihnen sehr dankbar, wenn Sie mir bei der Interpretation des Ergebnisses behilflich sein könnten!
Vielen Dank
Hallo Katharina,
ich würde es grafisch darstellen, das erleichtert die Interpretation. Nettoeinkommen auf der x-Achse, Lebenszufriedenheit auf der y-Achse, zwei Regressionsgeraden für Hochschulreife 0/1.
Hallo Herr Riepl,
tolle Seite. Hat mir bisher sehr weitergeholfen.
Ich schreibe selbst gerade meine Abschlussarbeit und sitze an einer moderierten Regression mit SPSS und bräuchte eine Anregung.
Folgendes Modell:
Meine abhängige Variable ist: Affektives Commitment (metrisch)
Meine unabhängige Variable ist: HR Maßnahmen im Unternehmen vorhanden oder nicht (binär -> Antwortauswahl Ja/Nein -> kodiert als Dummyvariable -> 0=nein, 1=ja).
Nun möchte ich den Zusammenhang der Variablen mit Hilfe von drei Moderatoren berechen.
Moderatoren:
– Geschlecht (binär -> 0=weiblich, 1=männlich -> kodiert als Dummyvariable)
– Alter (metrisch, mean centered)
– Bildungslevel (metrisch, meancentered).
Für jeden Moderator habe ich jeweils einen Interaktionsterm gebildet (UV * DummyVariableGender beziehungsweise UV * meancenteredModerator).
Ich habe jeweils einzeln für jeden Moderator eine moderierte Regression durchgeführt. Ich habe dies bereits gerechnet und die Moderation mit dem Geschlecht ist signifikant und die Moderation mit Alter und Bildungslevel jedoch nicht.
Ist dies generell so möglich? Oder haben Sie dafür eine bessere Lösung?
Und wie füge ich Kontrollvariablen ein? Meine Kontrollvaribalen sind Unternehmensgröße (metrisch, meancentered), Anzahl der Kinder (metrisch, meancentered) und Gehalt (metrisch, meancentered). Kann ich die jeweiligen Interaktionenterme einfach bei SPSS in das Feld für die unabhängige Variable zusätzlich hinzufügen (als zweites Modell)? Oder was muss ich da genau beachten?
Vielen Dank im Voraus.
Viele Grüße,
Julia
Hallo Julia,
1. Ja: Ich würde nicht mehr als einen Interaktionsterm pro Modell verwenden. Also separate Modelle. Die Wechselbeziehungen zwischen den Modellvariablen werden sonst sehr unübersichtlich.
2. Kontrollvariablen: Einfach als unabhängige Variablen aufnehmen. Technisch gibt es keinen Unterschied zwischen „Modellvariable“ und „Kontrollvariable“ – das ist nur ein Blickwinkel der Interpretation.
Ja, es kann sinnvoll sein, Modelle ohne und mit Kontrollvariablen zu vergleichen. Spannend ist bei solchen Fragestellungen (Hypothesentests) nicht so sehr „das eine, perfekte Modell“, sondern oft Veränderungen von Effekten zwischen verschiedenen Modellen. Z. B. ist ein Effekt nach Aufnahme von Kontrollvariablen nicht mehr signifikant? (Evtl. Scheinkorrelation.) Oder wird ein Effekt erst signifikant, wenn man eine bestimmte Kontrollvariable aufnimmt? (Evtl. verdeckte Korrelation.)
Hallo Herr Riepl,
Vielen Dank. Das hat mir sehr weitergeholfen.
Ich habe das mit den Kontrollvariablen umgesetzt.
Haben Sie noch einen Tipp, wie ich diese Werte in einer Tabelle in meiner Abschlussarbeit darstellen kann?
Also einmal das jeweilige Modell ohne Einbezug der Kontrollvariablen und einmal mit Einbezug der Kontrollvariablen? Ich soll dies in einer einzigen Tabelle darstellen (mit allen drei Moderatoren + Kontrollvariablen). Stecke da jedoch momentan etwas fest.
Viele Grüße,
Julia
Hallo Julia,
ein allgemeingültiger Tipp ist etwas gefährlich, weil es in unterschiedlichen Fachbereichen unterschiedliche Konventionen für die Darstellung geben kann. Ich würde in vergleichbaren Publikationen nachsehen (vom Prof. / Betreuer, andere Abschlussarbeiten beim gleichen Betreuer, Fachzeitschriften).
Anregungen für Tabellen hier – den Code elegant überspringen, nur auf die Tabellen schauen:
https://cran.r-project.org/web/packages/sjPlot/vignettes/tab_model_estimates.html
Lieber Wolf,
ich rechne in meiner Masterarbeit Moderationen mit Process aus. Nun habe ich bei allen vier Moderationsanalysen einen signfiikanten Interaktionseffekt, allerdings immer einen ichtsignifikanten Haupteffekt. Heißt dass, der Moderator hat trotzdem einen signifikanten Einfluss? Lieben Dank!
Hallo Steffi,
die Herausforderung besteht darin, dass man bei Modellen mit Interaktionseffekten keins der beteiligten Merkmale mehr unabhängig interpretieren kann: Ein Teil des Effekts steckt im Interaktionsterm, ein Teil in den einzelnen Variablen (Haupteffekten). Erst mal ist es plausibel, dass der Moderator offensichtlich einen Einfluss hat, wenn die Interaktion signifikant wird. Zusätzlich könntest Du noch ein Modell aufstellen ohne Interaktionsterm und damit die Haupteffekte einzeln interpretieren.
Ich nenne das „Mosaik-Ansatz“: Es gibt in diesem Kontext nicht das „eine, perfekte“ Modell; oft erhält man die Einblicke durch den Vergleich verschiedener Modelle und darüber, wie sich Effekte verändern.
Lieber Wolf,
dein Beitrag hat mir sehr für mein Modell (und die grafische Darstellung dessen) geholfen, danke dafür!
Nun komme ich bei folgenden Fragestellungen nicht weiter und wäre unendlich dankbar für Hilfe.
Ich habe ein Regressionsmodell mit insgesamt 5 UV und eine metrische AV. Eine der UV (UV1) ist eine Gruppierungsvariable (gruppierung der Fälle nach Zeitraum: Fall ist in t0 bzw. t1 aufgetreten). Nun möchte ich die Wechselwirkung der restlichen vier UV mit der Gruppierungs-UV (UV1) testen und habe ein weiteres Regressionsmodell mit 4 Interaktionstermen erstellt.
Nur einer der Interaktionsterme wird stat. signifikant, diesen Effekt habe ich grafisch dargestellt – er sieht etwa aus wie dein Bsp.3, nur dass die linken Enden der Linien sich nicht treffen, sondern ein geringer Abstand besteht
UV1, UV2 und Interaktionsterm sind dichotom (0, 1). Zur Grafik: die Linien schneiden sich nicht, beide fallen jedoch von t0 zu t1 ab, wobei die obere Linie (UV2 = 0) deutlich steiler abfällt.
Nun habe ich Schwierigkeiten mit der Interpretation:
1) Die UV hat im Haupteffektmodell einen negativen nicht-standardisierten Regressionskoeffizienten, die Moderatorvariable hat einen positiven und der Interaktionsterm im Interkationseffektmodell wieder einen negativen Koeffizienten. Ich habe irgendwo gelesen, dass wenn das Vorzeichen des Interaktionsterms und der UV1 übereinstimmen, wird der Effekt der UV1 auf die AV durch die Interaktion verstärkt. Ist das richtig so?
Also: Durch das Vorliegen der Ausprägung UV2=1 wird der Effekt der Gruppierungsvariable UV1 auf die AV verstärkt.
Vielen Dank im Voraus für Ihre Antwort und viele Grüße
Lilly
Hallo Lilly,
erst mal zum Modell: Ich rate davon ab, mehrere Interaktionsterme im gleichen Modell zu verwenden. Das gibt ziemlich komplizierte Variablen-Beziehungen. Ich würde es so einfach wie möglich halten. Wenn vier Interaktionen interessant sind, würde ich vier separate Modelle aufstellen, jedes mit einer Interaktion. Dann sollte die Interpretation etwas einfacher werden.
Unter welcher Bedingung (UV2=1 oder UV2=0) die Beziehung zwischen UV1 und AV verstärkt wird, müsste sich an der Grafik ablesen lassen: Welche Gerade verläuft steiler? Das finde ich klarer als die Kombination der Vorzeichen.
Wenn es unklar bleibt, könntest Du folgende Alternative versuchen: Teile den Datensatz in die Teile UV2=1 und UV2=0. Stelle für jeden Teildatensatz ein Regressionsmodell der UV1 auf die AV auf. Vergleiche die Koeffizienten. Welcher ist absolut gesehen größer (wenn ich Dich richtig verstanden habe: stärker negativ)?
Hoffe das hilft – viel Erfolg!
Lieben Dank, das hat mir tatsächlich geholfen. Die obere Gerade verläuft steiler, der Abstand zwischen den beiden Geraden wird nach rechts hin kleiner. Ich habe die Interaktionen nun auch in jeweils einzelnen Modellen (nur UV1, UV1 und Interkationsterm) getestet und tatsächlich werden noch mehr Interaktionsterme signifikant. Ich kann allerdings keine Quelle finden, die dieses Vorgehen befürwortet – weißt du hier weiter?
VG
Literatur: Hab jetzt keine zitierfähige Stelle parat … Weiß nicht, ob das sein muss. Ich würde es aus eigenen Überlegungen heraus begründen. Sobald man mehr als eine Variable im Modell hat, gilt der Effekt einer Variable „unter Konstanthalten aller anderen“. D. h. sobald es Korrelationen zwischen den Variablen gibt, ändern sich Effekte, wenn man Variablen zusätzlich aufnimmt bzw. Variablen ausschließt. D. h. es gibt Wechselwirkungen. Bei Interaktionstermen gilt das ganz besonders, denn hier gibt es ja praktisch immer Korrelationen zwischen UV, Moderator und Interaktionsterm. Mit mehr als einem Interaktionsterm vervielfachen sich die Wechselwirkungen und die Interpretation wird entsprechend unübersichtlich.
Das macht Sinn, ja. Mein Haupteffektmodell besteht ja aber aus 5 UV, für die Interaktionseffekte würde ich ja jeweils nur 2 UV + Interaktionsterm testen. Kann ich mich in der Interpretation dann dennoch auf das Haupteffektmodell beziehen oder müsste ich für jedes Interaktionsmodell erst noch ein Haupteffektmodell erstellen, dass nur die beiden UV enthält?
Wenn die UVs korrelieren (was nicht unwahrscheinlich ist, aber ich kenne die Daten nicht), werden sich Haupteffektmodelle mit unterschiedlich vielen UVs (mehr oder weniger deutlich) unterscheiden. Also wäre es wohl sinnvoll, zum jedem Interaktionsmodell das „passende“ Haupteffektmodell zu erstellen.
Falls die Unterschiede gering sein sollten (z. B. Koeffizient von UV3 in einem Modell mit weniger UVs vs. Haupteffektmodell mit allen UVs), könntest Du das ja im Text beschreiben, ggf. ohne alle einzelnen Modelle so ausführlich darzustellen.
Lieber Wolf,
ich hänge gerade am richtigen Vorgehen für die Moderation. Meine UV ist intervallskaliert, der Moderator dichotom (Geschlecht) und die AV intervallskaliert.
1) Ist es korrekt, dass ich erst bei Feststellung von Multikollinearität zentriere?
2) Bei der Zentrierung selbst: Wird die UV zentriert, der Moderator nicht, da dichotom (Hier jedoch umcodieren in 0 und 1, da bisher Mann 1 und Frau 2 codiert wird)?
3) Werden Kontrollvariablen auch zentriert?
Ganz viele Grüße 🙂
Kristin
Hallo Kristin,
ich weiß nicht, ob es da eine einfache Richtig-Falsch-Antwort gibt. Zentrieren verändert die Interpretation (z. B. Konstante). Den dichotomen Moderator würde ich nicht zentrieren. Du kannst ja verschiedene Varianten vergleichen, um zu sehen, wie sich das jeweils auswirkt, wie sich die Modelle verändern, welches Bild sich für die Interpretation ergibt.
Mir hat es geholfen, von der Denkweise „Ich will das eine richtige Modell finden“ zu der Denkweise überzugehen: Interessante Einblicke in meine Daten erhalte ich oft eher aus dem Vergleich verschiedener Modelle als aus dem „einen richtigen“ Modell.
Vielen Dank für den Tipp. Ich werde mir die verschiedenen Modelle einmal ansehen.
Lieber Herr Riepl,
ich schreibe derzeit meine Bachelorarbeit und komme bei einer statistischen Fragestellung zur Moderatoranalyse nicht weiter:
ich habe eine hierarchisch moderierte Regression mit Kontrollvariablen gerechnet und zuvor weder den Prädiktor noch die angenommene Moderatorvariable zentriert. Im Ergebnis waren die VIF-Werte > 10 relativ hoch.
Im Anschluss habe ich zunächst die Moderatorvariable zentriert, was die VIF-Werte deutlich gesenkt hat. Im Ergebnis war im ersten Modell zunächst nur die angenommene Moderatorvariable signifikant. Mit Hinzunahme des Interaktionsterms im zweiten Modell waren weder die Moderatorvariable noch der andere Prädiktor oder der Interaktionsterm signifikant. Das blieb im dritten Modell mit Hinzunahme der Kontrollvariablen auch so.
Wenn ich nun aber neben der Moderatorvariable auch den Prädiktor zentriere, ändert sich das Ergebnis. Die Moderatorvariable bleibt auch mit Hinzunahme des Interaktionsterms (Modell 2) und den Kontrollvariablen (Modell 3) signifikant, der Interaktionsterm sowie der andere Prädiktor sind nicht signifikant.
Welches Vorgehen ist denn nun richtig? Muss ich (wenn ich zentriere), immer sowohl die Moderatorvariable als auch den Prädiktor zentrieren oder nur die Moderatorvariable?
Ich tue mich auch mit der Ergebnisinterpretation schwer:
eine Moderation liegt nicht vor, da der Interaktionsterm ja nicht signifikant ist. Wie interpretiere ich denn dann den signifikanten Einfluss der angenommenen Moderatorvariable in Verbindung mit dem anderen nicht-signifikanten Prädiktor? Das alles verwirrt mich zunehmend.
Es wäre super, wenn Sie mir weiterhelfen könnten, da ich schon längere Zeit vergeblich nach einer Antwort in der Fachliteratur suche.
Vielen Dank und Grüße
Claudia
Hallo Claudia,
ich würde klären, worauf die hohen VIF-Werte (starke Multikollinearität) zurückzuführen sind. Zwischen welchen Variablen besteht die starke Korrelation? Moderator und Prädiktor? Prädiktor und Kontrollvariable(n)? Vielleicht ist eine Kontrollvariable verzichtbar, die ohnehin sehr stark mit anderen Merkmalen korreliert.
Zum Zentrieren gibt es (leider) unterschiedliche Empfehlungen. Wahrscheinlich ist es besser, zuerst die Multikollinearität in den Griff zu bekommen, danach sollte die Modellierung / Interpretation einfacher werden. Durch Zentrieren ändert sich die Interpretation der Koeffizienten und der Konstante, da sich der 0-Bezugspunkt ändert.
https://www.researchgate.net/post/While_testing_moderating_effect_is_it_necessary_to_center_the_variables
Im Modell mit Interaktionsterm ist die Interpretation der einzelnen Koeffizienten schwierig: Der Effekt eines Prädiktors (der im Interaktionsterm enthalten ist – gilt für Prädiktor und Moderator) steckt nun nicht mehr in einem Koeffizienten allein, sondern in beiden gemeinsam: Der Variable „einzeln“ und dem Interaktionsterm.
In Ihrem Fall klingt es so, als ob nur der Moderator einen (statistisch abgesicherten) Einfluss auf die abhängige Variable hat.
Ich empfehle grafische Darstellungen, wenn möglich.
Haben Sie auch Modelle ohne Interaktionsterm aufgestellt? Ich würde alle vergleichen: 1. Nur Prädiktor, 2. nur Moderator, 3. Prädiktor und Moderator, aber ohne Interaktionsterm, 4. Volles Modell mit Prädiktor, Moderator und Interaktionsterm.
Viel Erfolg
Wolf
Hallo Herr Riepl,
vielen Dank für Ihre Hinweise! Das hilft mir bereits weiter. Nur bin ich ratlos, was für eine grafische Darstellung in diesem Fall hilfreich wäre.
Ich habe vor den eigentichen Hypthesentestungen eine Korrelationsanalyse der beteiligten Variablen durchgeführt. Hier waren keine extremen Korrelationen zu erkennen. Die höchste Korrelation bestand zwischen dem Prädiktor und der angenommenen Moderatorvariable (-.350).
Der VIF-Wert der Moderatorvariable liegt ohne die Zentrierung breits im ersten Modell – also nur Prädiktor und Moderatorvariable – bereits über 10.
Wenn ich allerdings den Moderator zentriere, liegen die VIF-Werte im gesamten Modell bei unter 5. Demnach muss ich wohl den Moderator zentrieren, da ich die Multikolleniarität auf keinem anderen Weg reduzieren kann. Ich habe im ersten Modell ja nur zwei Variablen und diese benötige ich beide für die Hypothese.
Es stimmt, dass bislang nur die angenommene Moderatorvariable einen signifikanten Einfluss hat. Je nachdem, ob ich ebenso den Prädiktor zentriere, verschwindet dieser signifikante Einluss aber mit Aufnahme des Interaktionsterms.
Ist es mögich, dass primär ein nicht-linearer Zusammenhang vorliegt und ich es nur nicht merke?
Bisher habe ich die hierarchische Regression wie folgt aufgebaut:
Modell 1: Prädiktor und angenommene Moderatorvariable
Modell 2: Prädiktor, angenommene Moderatorvariable und Interaktionsterm
Modell 3: Prädiktor, angenommene Moderatorvariable, Interaktionsterm und Kontrollvariablen
Viele Grüße
Claudia
Hallo Claudia,
es gibt manchmal Fälle von Multikollinearität „in höheren Dimensionen“, die sich nicht an der Korrelationstabelle zwischen jeweils zwei Variablen zeigt. Z. B. Variablen x1 und x2 korrelieren gemeinsam (aber nicht so stark einzeln) mit x3. Das ist hier aber wohl nicht der Fall, zumindest spricht Ihre Beschreibung von Modell 1 dagegen.
Nichtlinearität könnte eine Erklärung sein für den hohen VIF-Wert im ersten Modell.
Das könnten Sie untersuchen: z. B. vergleichsweise mit einem Modell mit quadratischem Term, oder grafisch mit einem Streudiagramm mit Lowess-Anpassungskurve.
Das nur als Möglichkeit – vielleicht genügt es auch, die Befunde sorgfältig zu beschreiben und bestmöglich zu interpretieren. Neulich sagte ein Kursteilnehmer so schön: Das Problem sind ja nicht die Modelle, das Problem ist die Realität …
Zur ersten Frage, welche Grafik? Vorschlag: Abhängige Variable auf der y-Achse, Prädiktor auf der x-Achse, Regressionsgeraden für hohe und niedrige Ausprägung des Moderators.
Lieber Herr Riepl,
vielen Dank für Ihre Erklärung. Da wir uns im Bachelorstudiengang nicht mit Nichtlinearität beschäftigen, werde ich wohl bei der ausführlichen Befundbeschreibung bleiben (auch, wenn es mich schon interessieren würde). Aber allein die Erklärung, dass Nichtlinearität hierfür verantwortlich sein könnte, bringt mich um einiges weiter.
Vielen Dank dafür!
Werter Herr Riepl,
ich bin derzeit am Schreiben meiner Abschlussarbeit und möchte untersuchen, ob und inwiefern durch die Produktpräsentation eines Influencers (im Vgl. zu einem normalen Werbebanner) die sensorische Wahrnehmung von Produkteigenschaften beeinflusst werden kann und ob diese Form der Produktpräsentation einen Einfluss auf bestimmte Konsumentenreaktionen (Kaufabsicht etc.) besitzt. in diesem Zuge habe ich 3 Moderatorvariaben identifizieren können: Vertrauen, Authentizität und Glaubwürdigkeit. Nun stellt sich mir die Frage wie ich den Einfluss jeder einzelnen Moderatorvariablen auf bestimmte Konstrukte untersuchen kann.
Kurz zur Veranschaulichung des Effektes, den ich untersuchen möchte:
Produktpräsentation des Influencers —————-> z.B. Kaufabsicht [auf diesen Wirkungszusammenhang wirkt nun eine der drei Moderatorvariablen, nehmen wir an Vertrauen]
abhängige Variable: Kaufabsicht
Da allerdings meine unabhängige Variable nun die Produktpräsentation (PP) ist, die in meinem Fragebogen randomisiert zugelost wurde (Ausprägungen: 1=Influencer-PP; 2=Werbebanner PP) bin ich mir ziemlich unschlüssig wie ich ich dort jetzt den Moderatoreffekt bzw. Interaktionseffekt des Vertrauens berechnen kann. Alle anderen Konstrukte habe ich mithilfe von Multi-Itemskalen (Likert) gemessen.
Ich freue mich auf Ihre Antwort und Lösungsvorschlag
Mit freundlichen Grüßen
Hallo Matthias,
wenn ich es richtig verstehe, ist der Knackpunkt: Wie kann die Produktpräsentation mit zwei Ausprägungen in den Moderatoreffekt eingehen? Technisch ist der Interaktionsterm das Produkt aus UV und Moderator: ganz wörtlich die Multiplikation der beiden Variablen. Das gilt auch für Variablen mit nur zwei Ausprägungen, auch wenn das „komisch“ aussieht.
Die konkrete Umsetzung kann in verschiedenen Statistikprogrammen unterschiedlich sein. In SPSS habe ich früher eine neue Variable berechnet, die buchstäblich die Multiplikation der beiden Variablen (UV und Moderator) enthielt:
z. B. Interaktionsterm = Produktpräsentation mal Vertrauen.
Empfohlen wird dann, sowohl den Interaktionsterm als auch die beiden Variablen einzeln in das Modell aufzunehmen.
z. B. Kaufabsicht = Vertrauen + Produktpräsentation + Interaktionsterm
In R muss man dem Datensatz keine neue Variable hinzufügen, man kann die Interaktion direkt in der Modellformel angeben.
Kurzschreibweise: Modell <- lm(Kaufabsicht ~ Vertrauen:Produktpräsentation) Gleichbedeutend mit: Modell <- lm(Kaufabsicht ~ Vertrauen + Produktpräsentation + Vertrauen * Produktpräsentation) Hoffe das hilft - viel Erfolg! Wolf
Lieber Herr Riepl,
Ich schreibe gerade an meiner Masterarbeit und hätte eine Frage an Sie. Ich weiß, dass bereits ähnliche Fragen gestellt wurden, kann die Antworten aber leider nicht auf meine Daten anwenden… Vielleicht können Sie mir ja weiterhelfen.
Ich möchte untersuchen ob der Einfluss von Agilem Arbeiten (UV, metrisch) auf Projekterfolg (AV, metrisch) durch das Erfüllen verschiedener Projekteigenschaften (Moderator, kategorial mit 3 Stufen) moderiert wird. Dafür habe ich den Moderator schon in 2 Dummy-Variablen kodiert. Ich bin mir jedoch nicht sicher wie ich weiter vorgehen soll.
Bilde ich nun 2 Interaktionsterme (also aus Agilität x jeweilige Dummy Variable)? Und füge ich dann in mein Regressionsmodell beide Interaktionsterme ein, oder rechne ich ein getrenntes Modell für jeden Dummy-Moderator?
Weiterhin bin ich mir nicht sicher, was eine signifikanter Einfluss eines Interaktionstermes dann genau aussagen würde.
Vielen Dank im Voraus für Ihre Hilfe!
Liebe Grüße
Timo
Hallo Timo,
ich würde es vermeiden, mehr als einen Moderator im gleichen Modell zu haben. Mit einem Moderator ist es ja schon so, dass der Effekt einer Variablen nicht mehr nur an einem Term abzulesen ist, sondern an zweien: Der Variable einzeln und dem Interaktionsterm. Bei mehr als einem Interaktionsterm gibt es noch mehr Wechselwirkungen und damit Kombinationsmöglichkeiten und ich fände die Interpretation mehr als herausfordernd. Muss gestehen, dass ich seit einer Weile keine konkreten Projekte mit komplexeren Wechselwirkungen bearbeitet habe. Vielleicht lohnt sich ein Blick auf aktuelle Literatur dazu.
Ich würde zwei Modelle aufstellen, vergleichen und diskutieren. Wenn ein drittes (mit der dritten Ausprägung der Projekteigenschaften) zusätzliche Erkenntnis bringt, dann das mit verwenden.
Generell finde ich die Interpretation grafisch einfacher als nur numerisch.
Viel Erfolg!
Wolf
Lieber Wolf
Eine sehr interessante Seite! Ich hab dazu noch eine Frage: Ich bin zurzeit an der Auswertung meiner Daten anhand eines multiplen Regressionmodells. Nun habe ich den Interaktionsterm eingefügt, welche nucht signifikant ist. Dennoch möchte ich diesen grafisch darstellen. Wie kann ich eine solche Grafik ich R erstellen bzw. welchen Code/Befehl hast du für deine Grafiken verwendet?
Vielen Dank für deine Hilfe!
Liebe Grüsse aus der Schweiz
Michelle
Hallo Michelle,
ich habe ggplot2 verwendet. Um die Interaktion zu zeigen, würde ich Gruppen als Ästhetik definieren (z. B. Farbe) und dann Anpassungsgeraden mit geom_smooth einfügen. geom_smooth „erbt“ die Ästhetiken und erstellt automatisch zwei Geraden, wenn es zwei (Farb-)Gruppen gibt.
Beispiel – Code bitte für Deinen Anwendungsfall anpassen:
library(MASS)
data(Boston)
library(ggplot2)
ggplot(Boston, aes(x = lstat, y = medv, color = factor(chas))) +
geom_point(alpha = 0.8) +
geom_smooth(method = „lm“, se = FALSE) +
labs(x = „Bevölkerungsanteil mit niedrigem Status in Prozent“,
y = „Median Wohnungspreis in 1.000 USD“,
title = „Modell: lm(medv ~ lstat * chas, data = Boston)“) +
scale_color_discrete(name = „Lage am Charles River?“) +
theme(legend.position = „bottom“)
ggsave(„lm_mit-Interaktion.png“)
Guten Tag
Eine wunderbare Seite:)
Ich habe eine Frage, deren Antwort ich trotz Recherche immernoch nicht beantworten konnte…
Ich habe eine nominal skalierte Moderatorvariable, welche nicht dummy ist, sondern 6 Ausprägungen annehmen kann (sozialdemokratisch, liberal, etc..) … die OLS-Regression konnte ich bereits rechnen in R. Nun weiss ich jedoch nicht, wie ich dies zu interpretieren habe.
Vielen Dank im Voraus 🙂
Zora
Hallo Zora,
weiß R, dass die Variable nominalskaliert ist? Du kannst sie als Faktor definieren – wie sieht es dann aus?
Ich denke als Moderatoreffekt mit 6 Ausprägungen wird die Interpretation eher kompliziert. Ich würde das wohl in Zweier-Gegensatzpaare aufteilen, z. B. sozialdemokratisch ja/nein in einem Modell. Wenn alle Modelle wichtig sind, dann eben für jede Ausprägung ein Modell: liberal ja/nein als Moderator, usw.
Wolf
Lieber Wolf
Vielen Dank für die schnelle Antwort:)
ja ich habe die Variable als Faktor definiert:
WFS_R = as.factor(c(„Sozialdemokratisch“, „Sozialdemokratisch“,“Konservativ“, „Post_Communist“, „Konservativ“,
„Former_UdssR“, „Mediterran“, „Konservativ“, „Konservativ“, „Liberal“,
„Post_Communist“,“Liberal“, „Mediterran“, „Former_UdssR“, „Sozialdemokratisch“, „Sozialdemokratisch“,
„Post_Communist“, „Mediterran“, „Sozialdemokratisch“ ))
Das habe ich mir auch überlegt, aber dann kann ich ja nur die Unterschiede betrachten und nicht ob die Interaktion signifikant ist? So wie ich meinen Output interpretiere, nimmt es einfach eine Ausprägung (Former_UdssR) als Referenzkategorie. Heisst das, dass ich einfach nur mit einer Ausprägung vergleichen kann?
R behandelt die Variable im Modell nun so, als ob sie dummy-codiert wäre. Bei Dummy-Codierung „per Hand“ müsstest Du auch eine Variable weglassen und als Referenzkategorie interpretieren. Du kannst den Effekt jeder Kategorie im Vergleich zur Referenzkategorie interpretieren.
Gibt es keine zusätzlichen Terme für die Interaktion?
Hmm.. Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?
Doch den gibt es:
OLS_Reg1 <- lm(Einst_Immigr ~ election + WFS_R + election * WFS_R, df_country)
R gibt mir auch signifikante Werte aus.
Das ist der Output von der OLS-Regression:
Einfluss von RPP auf Einstellung und WFSR
Dependent variable:
Einst_Immigr
election 7.259**
(2.981)
WFS_RKonservativ 0.635**
(0.232)
WFS_RLiberal 0.620**
(0.232)
WFS_RMediterran 0.636**
(0.232)
WFS_RPost_Communist 0.543*
(0.233)
WFS_RSozialdemokratisch 0.654**
(0.232)
election:WFS_RKonservativ -7.325**
(2.983)
election:WFS_RLiberal -7.410**
(2.988)
election:WFS_RMediterran -8.988**
(3.034)
election:WFS_RPost_Communist -7.299**
(2.982)
election:WFS_RSozialdemokratisch -7.528**
(2.983)
Constant 0.107
(0.231)
Observations 19
R2 0.918
Adjusted R2 0.789
Residual Std. Error 0.019 (df = 7)
F Statistic 7.106*** (df = 11; 7)
Note: *p**p***p<0.01
Also kann ich keine Aussage darüber machen, wie die anderen Kategorien zueinander stehen?
Man kann vergleichen, wie jede Kategorie im Verhältnis zur Referenzkategorie dasteht. Ein Jeder-mit-jedem-Vergleich (ähnlich post-hoc bei ANOVA) ist hier nicht vorgesehen.
Das Modell halte ich für schwer interpretierbar. Jeder Effekt ist zu interpretieren unter der Prämisse, dass alle anderen Effekte konstant gehalten werden. Das ist jedoch problematisch, da die Interaktionseffekte nicht von einander unabhängig sind. Das heißt: Die Effekte werden anders aussehen, wenn man separate Modelle aufstellt mit jeweils nur einem Interaktionsterm. Es gibt im obigen Modell sehr viele Wechselwirkungen, die sich gegenseitig beeinflussen.
Hallo Zusammen,
ich habe zur Identifikation verschiedener Prädiktoren und Moderatoren lineare bzw. multivariate Regressionen gerechnet. Jetzt hat meine Betreuerin gesagt, dass ich das Ganze anhand eines Pfadmodells prüfen soll. Für die Prädiktoren (insgesamt 5) habe ich ein Pfadmodell erstellt, es gibt mir allerdings keine Angaben zum Chi2 sowie dem Modelfit (RMSEA) aus. Ich habe gelesen, dass das daran liegen kann, dass das Modell zu klein ist?! Eine Bekannte hat ein größeres Modell und nutzt den selben R-Befehlt und bekommt alle Werte ausgegeben. Kann es also daran liegen, dass es mit diesem Modell nicht möglich ist Werte angegeben zu bekommen?
Außerdem frage ich mich mittlerweile, ob ihr Kommentar bezüglich des Pfadmodells ausschließlich auf die Prädiktoren bezogen war. Ich habe viel gelesen zu Pfadmodellen und immer nur Beispiele zur Mediation gefunden. Mittlerweile bin ich daher fast sicher, dass eine Moderation nicht in einem Pfadmodell getestet werden kann, da der Moderator eine UV ist. Oder gibt es dafür eine Möglichkeit, die mir nicht bekannt ist und selten verwendet wird (daher online nicht auffindbar)?
Für die Prädiktoren habe ich mir außerdem die Kovarianzen ausgeben lassen, finde aber keine Information dazu ab wann Variablen „hoch“ kovariieren. Ich weiß, dass ein Wert nahe 0 sehr gut ist, aber wie sieht es beispielsweise mit Werten wie 0.56 aus?
Vielen Dank bereits im Voraus für ihre Antwort.
Hallo Ben,
sorry, eine Ferndiagnose zu dem Pfadmodell kann ich leider nicht stellen.
Kovarianzen sind von Einheiten der verwendeten Variablen abhängig und damit meines Erachtens nicht allgemeingültig interpretierbar. Standardisierte Maße wie Korrelationskoeffizienten sind dafür besser geeignet. Allerdings sind auch dann Zusammenhänge im Forschungskontext zu betrachten. Bei einer sozialwissenschaftlichen Fragestellung bewerte ich eine Korrelation anders als bei einer technischen Fragestellung (z. B. Produktionsprozess), bei der nicht gemessene Einflüsse viel besser kontrolliert werden können.
Hallo,
vielen Dank für die Antwort.
Wissen Sie denn ob es generell möglich ist eine Moderation mit einem Pfadmodell zu testen?
In allen Beispielen zur Moderation die ich gefunden habe werden immer nur Regressionen gerechnet..
Ich rechne auch Regressionen dafür …
Guten Tag.
Ich führe zum ersten Mal eine quantitative Analyse (Moderatoranalysen) durch und habe eine Frage bezüglich R-Studio:
Meine AV, einige meiner UV und einige meiner potentiellen Moderatoren sind nicht normal verteilt. Wie gehe ich damit um? Kann ich die Moderatoranalyse trotzdem durchführen oder muss ich vorher einige Schritte durchführen? Ich habe z.B. von Bootstrapping gehört und bin unsicher, ob das in diesem Fall angebracht ist und wie man dies in R-Studio durchführt.
Vielen Dank für Ihre Hilfe.
Mfg Jule
Hallo Jule,
fehlende NV: schwer, das pauschal zu beantworten. Einige Anhaltspunkte: Je größer die Stichprobe, desto weniger fallen Abweichungen von der NV ins Gewicht. Wie wurde die fehlende NV ermittelt – per statistischem Test oder (auch) grafisch? Tests wie Shapiro-Wilk (oder auch Kolmogorov-Smirnov) werden gerade bei größeren Stichproben „leichter“ signifikant. Wenn die Abweichungen nicht allzu drastisch sind, kann man das dokumentieren und die Analysen dennoch durchführen – es gibt es etwas Ermessensspielraum und bei vielen Studien sind nicht alle Testvoraussetzungen streng erfüllt.
Zum Bootstrapping: Da gibt es das Boot-Paket in Base R (Teil der Standard-Installation). Man schreibt die Analyse als Funktion und lässt diese Funktion „bootstrappen“, also z. B. 1000 Mal mit Zufallsstichproben mit Zurücklegen aus dem Datensatz schätzen. Dann erhält man Verteilungen der Kennwerte, die oft brauchbarer (realistischer) sind als Kennwerte, die mit statistischen Formeln geschätzt werden. Gibt Anleitungen zum Vorgehen im Netz.
Hallo,
vielen Dank für die schnelle Antwort.
Mein Datensatz umfasst 284 Teilnehmer, er sollte eigentlich groß genug sein.
Die Normalverteilung habe ich durch Histogramme sowie den Shapiro-Wirk Test beurteilt.
Im Fall der Variable „sozialer Druck“ liegt er beispielsweise bei .0049 (was wahrscheinlich noch okay ist), während bei einigen anderen Variablen ein z.B. p-Wert von 6.184e^-07 ausgegeben wird. Die AV, auf welche mehrere UV und Moderatoren getestet werden, ist laut meinem Histogramm ebenfalls nicht normal verteilt und erhält den p-Wert 2.676e^-10 (welcher laut Google als p = .121 berechnet wird).
Denken Sie bootstrapping ist in diesem Fall angebracht, um eine Normalverteilung zu generieren? Ich bin heute erst auf dieses Problem gestoßen und finde leider aktuell keine Antworten darauf, wann man bootstrapping durchführt und wann nicht. Soweit ich es verstanden habe, ist es allerdings eine Möglichkeit Probleme wie die ungleiche Verteilung zu umgehen. Anderseits kenne ich mich leider kaum in R aus, sodass ich unsicher bin, ob dies meine Kompetenzen nicht übersteigt.
Vielen Dank für Ihren Rat.
Mfg
Achtung, 2.676e-10 = 0.0000000002676. Das ist keine „e-Funktion“, sondern sog. wissenschaftliche Notation. Die Zahl nach dem e gibt die Anzahl der Dezimalstellen an.
Ich würde nicht nur auf p-Werte schauen. Wenn die Verteilungen optisch einigermaßen vertretbar sind, ist es ok. Histogramme können auch etwas irreführen, da sie von der Breite der Kategorien abhängig sind. (Kann man variieren, um einen besseren Eindruck zu bekommen.)
Bootstrapping generiert keine Normalverteilung. Es hilft lediglich, Verteilungen von Parametern (z. B. Konfidenzintervalle) ohne ohne Annahmen über Verteilungen der Variablen zu schätzen. Die Schätzung erfolgt nicht auf Basis von Formeln (die bestimmte Verteilungen voraussetzen), sondern in Form einer Simulation. So, als ob man eben zum Beispiel 1000 Stichproben hätte statt nur einer.
Ah okay, das heißt 3.151e-06 = 0,000003151 ?!
Ich habe gedacht die p-Werte seien gerade deswegen relevanter, da die Histogramme optisch oft täuschen.
Ich finde es allerdings irritierend, dass das Histogramm normal verteilt wird und der Shapiro-Wirk Test eine hohe Signifikanz verzeichnet.
Wenn ich das richtig verstehe, kann ich die moderierte Regression also einfach rechnen ohne auf eine Alternative wie das Bootstrapping-Verfahren zurückzugreifen :).
Da ich noch nie quantitativ geforscht habe und keine Hilfestellung der Uni erhalte, habe ich ziemliche Angst, dass mir ein Fehler unterläuft und nachher die Ergebnisse alle „falsch“ bzw. nicht interpretierbar sind.
Mfg
Jule
3.151e-06 = 0,000003151 Ja
Kann man in R testen:
3.151e-06 == 0.000003151
[1] TRUE
Die p-Werte sind tendenziell zu streng bei größeren Stichproben (N=284 zähle ich dazu). Ich würde die p-Werte der NV-Tests dokumentieren und diskutieren.
Und ja, ich denke die Regression ist vertretbar.
In der Statistik gibt es viele Ermessensspielräume, es geht mehr um Wahrscheinlichkeiten und Annäherungen und nicht um exakte Wahrheit – die findet man statistisch nicht. Daher ist es wichtiger, das Vorgehen gut zu dokumentieren. Es dürfte kaum eine Studie geben, die „perfekt“ ist in dem Sinne, dass alle Voraussetzungen exakt erfüllt werden. Wichtiger ist, dass man mit Bewusstsein für Möglichkeiten und Grenzen der Methoden vorsichtig interpretiert.
Es hört ja nicht auf bei den Normalverteilungen. Die meisten Zusammenhänge sind „in Wirklichkeit“ nicht linear. Dennoch sind lineare Regressionsmodelle sinnvolle und nützliche Werkzeuge.
„Alle Modelle sind falsch, aber manche sind nützlich.“ (All models are wrong, but some are useful.)
Hallo.
Ich teste zurzeit mehrere Moderationen.
Es geht um unter anderem darum, ob Need to Belong (Moderator) den Zusammenhang zwischen Selbstkontrolle (UV) und Social Media-Prokrastination (AV) moderiert. Die Analyse findet in R statt und ich habe bereits die notwendigen Befehle.
Meine Frage: Ich habe ein Referat einer Moderationsanalyse in dem nicht auf Kontrollvariablen getestet wird.
Ist das üblich oder sollte ich Variablen wie Alter, Geschlecht etc. definitiv in das Regressionsmodell einfließen lassen?
Vielen Dank
Ismail
Deine Entscheidung 🙂
Genauer hinzuschauen und Kontrollvariablen zu testen ist keine schlechte Idee. Allerdings muss man entscheiden, wo man die Grenze zieht … Man könnte auch noch Wechselwirkungen (Interaktionen) testen oder nichtlineare Zusammenhänge – es gibt da viele Möglichkeiten und man wird nicht alle abdecken können. Meine Empfehlung ist, theoriegeleitet vorzugehen (und nicht „auf Verdacht“ ganz viel zu testen). Gibt es Gründe für die Annahme, dass Alter oder Geschlecht eine Rolle spielen?
Oft ist es besser, sich etwas weniger vorzunehmen und das dafür sorgfältig auszuarbeiten, anstatt sich mit zu vielen Ideen zu verzetteln …
Vielen Dank für die schnelle Antwort!
Es gibt in der Theorie nicht wirklich Indikatoren für mögliche Kontrollvariablen. Also werde ich da auf jeden Fall weniger testen als zunächst überlegt.
Ich habe noch eine Frage bezüglich der Voraussetzungen die zu testen sind.
Bevor ich die Moderationen teste, untersuche ich den Zusammenhang zwischen der UV und AV.
Ich versuche so Prädiktoren für Social Media-Prokrastination zu identifizieren.
Nachdem ich eine bivariate Regression durchgeführt habe, die einen hohen signifikanten Zusammenhang zwischen habitualisierter Nutzung so Social Media-Prokrastination zeigt, habe ich nun die Voraussetzungen getestet.
Der breusch-pragan Test hat jetzt ergeben, dass p < .005 ist und entsprechend Heteroskedastizität vorliegt.
Ich weiß allerdings nicht wie ich damit nun umgehen muss.
Danke schon einmal im Voraus !
Vielleicht kannst Du herausfinden, woran es liegt. Wie sieht das Streudiagramm aus? Vielleicht ist der Zusammenhang nichtlinear? Wie sind die Residuen im Moderator-Modell verteilt – vielleicht sieht es da besser aus? Hat eine weitere Variable im Datensatz einen starken Einfluss, sodass ein Modell mit dieser Variablen besser aussieht?
Auch wenn Du keine exakte Antwort herausbekommst, warum Heteroskedastizität vorliegt: Ergebnis dokumentieren und diskutieren.
Okay, vielen Dank :).
Ich kann die Analyse also trotzdem so durchführen und muss das Ganze nur am Ende diskutieren und versuchen einzuordnen? Ich habe nämlich befürchtet die Analyse jetzt nicht durchführen zu dürfen etc.
Voraussetzungen sind oft verletzt … Schöner ist es natürlich, wenn man die Ursache findet und womöglich sogar beheben kann. Vielleicht liegt es auch an einzelnen Ausreißern …
Vielen Dank für diesen ausführlichen Beitrag! Mein Datensatz erfüllt die Voraussetzungen nicht. Ich habe statt ANOVA und Pearson, Mann-Whitney Test gemacht und lineare multiple Regression berechnet mit dem Vermerk, dass es mir um reine Unterschiede geht. Soweit war mein Professor damit einverstanden. Bei der Moderation empfiehl er mir die Z standardisierte Variablen zu erstellen und damit rechnen. Ich habe aber keine Normalverteilung in den Residuen und sonst auch keine Normalverteilung. Also habe ich meine Variablen nicht mittelwertzentriert. Können Sie mir helfen das zu begründen? Denn bei der Zentrierung werden die Werte nur im Wertebereich um 1 bis -1 variieren, ansonsten ändert sich ja nicht viel. Er meinte, ich habe dann das Problem das ganze sinnvoll zu interpretieren. Mein Moderator ist dichotom, AV ist quasimetrisch, es kam raus, dass Interaktionseffekt signifikant von null verschieden ist. Ich möchte damit nur zum Ausdruck bringen, dass eine Kategorie trägt zur Erklärung der Varianz mehr bei als andere Kategorie. Deswegen habe ich es so begründet, dass die Haupteffekte nicht zu interpretieren sind und die Ergebnisse sind eher heuristisch zu betrachten. Kann ich das so machen und mit einer Quelle begründen, wenn ja mit welcher? Ich habe leider nichts gefunden.
Vielen Dank! Und viele Grüße!
Hab leider keine Quelle zur Hand
Hallo Wolf,
in meiner Moderatoranalyse ist die Interaktion nicht signifikant. Die Moderatorvariable und die Prädiktorvariable jedoch schon. Wie interpretiere und berichte ich dies nun richtig? Ein Moderatoreffekt liegt also nicht vor, da der Interaktionsterm nicht signifikant ist, richtig? Vielen Dank und viele Grüße, Max
Hallo Max,
ja, das klingt plausibel. Das heißt: Der Effekt des Prädiktors hängt nicht von der Ausprägung der Moderatorvariable ab. Anders formuliert: Es gibt keine Wechselwirkung zwischen Moderator und Prädiktor.
Viel Erfolg und viele Grüße,
Wolf
Zunächst vielen Dank ihnen für ihre tollen Erklärungen.Allerdings habe ich noch eine Frage, auf die ich auch in den Kommentaren hier noch keine Antwort gefunden habe:
Ich rechne zur Zeit ein Modell mit einem Interaktionseffekt. Einer meiner Haupteffekte und der Interaktionseffekt sind signifikant. Der andere Haupteffekt ist nicht signifikant.
Was bedeutet dies für die Interpretation meines Modells?
Hallo Justus,
es gibt eine signifikante Wechselwirkung (Interaktion) zwischen den beiden Variablen, die den Interaktionsterm bilden. D. h. der Effekt der einen UV hängt vom Zustand der anderen UV ab. Darüber hinaus würde ich die beiden Haupteffekte im Modell beschreiben (einer sig., einer nicht). Wenn Du es ausführlicher machen willst, kannst Du noch zusätzlich ein Modell ohne Interaktionsterm aufstellen und die Ergebnisse vergleichen.
Viele Grüße!
Wolf
Ich hätte auch eine Frage:
In meiner Bachelorarbeit ist mein Modell signifikant, aber die einzelnen Parameter und die Interaktion nicht. Wie interpretiere ich dies nun ??
Vielen Dank schonmal!!
Hallo Carlotta,
„Modell sig.“ heißt Anova (F-Test) insgesamt für alle Variablen sig., aber keine unabhängige Variable inklusive Interaktionsterm? Formulierungsvorschlag: Alle Variablen GEMEINSAM leisten einen signifikanten Erklärungsbeitrag, wobei kein einzelner Prädiktor signifikant wird. Ein Interaktionseffekt konnte nicht nachgewiesen werden.
Das Modell ist insgesamt signifikant „besser“ als das Null-Modell ganz ohne Prädiktoren (das immer den Mittelwert der abhängigen Variable voraussagt). Jeder Prädiktor für sich genommen bleibt aber unter der Signifikanzschwelle.
Hallo, vielen Dank für die ausführlichen Erläuterungen. Diese waren sehr verständlich und gut erklärt!
Ich hätte noch eine weitere Frage:
Ich gehe hypothethisch von einem negativen Effekt von UV1 auf die AV aus. Parallel dazu gehe ich auch von einem negativen Effekt von UV2 auf die AV aus. Zusätzlich gehe ich davon aus, dass der negative Effekt von UV1 auf die AV noch stärker, also noch negativer wird, wenn UV2 ansteigt. Also im Prinzip genauso wie in deinem dritten Beispiel.
Frage: Ich habe einen Interaktionsterm (UV1 * UV2) kreiert und teste diesen via Regression auf AV. Gehe ich davon aus, dass das Vorzeichen des Interaktionskoeffizienten jetzt positiv oder negativ ist?
In meinem Fall ist er nämlich negativ. Das verwirrt mich. Hätte gedacht, dass ich von einem positiven Interaktionseffekt ausgehe, da die Wirkung doch verstärkt wird (im Sinne von minus mal minus gleich plus).
Liebe Grüße,
Sebastian
Ich empfehle grafische Darstellung zur Interpretation der Interaktion.
Das mache ich auch in der Arbeit. Meine graphische Darstellung sieht genauso aus, wie ihr drittes Beispiel. Allerdings habe ich eben auch genau diesen Interaktionseffekt in einem hierarchischen Multilevel Regressionsmodell. Und dort ist mein Interaktionskoeffizient negativ. Und das verwirrt mich.
Anders gefragt: Ich geh von dem dem dritten Beispiel auf dieser Seite aus: „Je höher das Übergewicht, desto geringer die Ausdauer. Bei Rauchern ist dieser Zusammenhang stärker als bei Nichtrauchern.“
Wäre das Vorzeichen der Interaktion (wenn ich Nichtraucher oder Raucher mal nicht als Dummy, sondern als metrische Variable, z.B. gerauchte Zigaretten am Tag, abbilden würde) „Gerauchte Zigaretten am Tag“ x „Übergewicht“ positiv oder negativ?
Das mag ich nicht so pauschal beantworten. Es hängt von allen Variablen im Modell ab, nicht vom Interaktionseffekt allein. Ggf. einfach anfangen und schrittweise Variablen aufnehmen. Jede Korrelation zwischen UVs kann die Effekte verändern.
Okay, dann noch einmal anders gefragt 🙂
Bedeutet ein negatives Interaktionsvorzeichen bei zwei Variablen die einen negativen Effekt auf die AV haben, dass der Einfluss von UV1 sich mit ansteigender UV2 näher in Richtung 0 oder negativer (im Sinne von stärker in Richtung – unendlich) verschiebt?
Beide Variablen sind nicht Teil des spezifischen Modells.
Die grafische Darstellung müsste die Frage beantworten … In der linearen Regression sind wir bei Geraden. D. h. die Gerade wird nicht bei 0 „abknicken“ – sie kann nur steigen oder fallen, oder parallel zur x-Achse verlaufen.
Hallo Herr Riepl,
erstmals vielen Dank für das verständliche Aufbereiten dieses Themas. Dadurch ist es mir, einem Anfänger in Sachen Statistik, gelungen, die Ergebnisse einer Moderatoranalyse zu visualisieren.
Nun stelle ich mir jedoch die Frage, wie ich die Stärke des Moderatoreffektes quantifizieren kann.
Beispiel: Anhand der Grafiken sehe ich zwar, dass der Moderator den positiven Zusammenhang zwischen meiner UV und AV abschwächt, jedoch würde ich gerne präzise feststellt, wie stark der Zusammenhang abgeschwächt wird. Können Sie mir weiterhelfen und sagen, woher ich die Stärke des Effektes entnehmen kann?
Danke und viele Grüße
Hallo Patrick,
Sie können den Rückgang des Regressionskoeffizienten B der UV sowie die Veränderung des p-Wertes der UV beschreiben. Vergleichen Sie dazu das Modell ohne Interaktionsterm mit dem Modell mit Interaktionsterm. Dazu können Sie die Veränderung in R² ergänzen. Es gibt weitere Gütemaße wie AIC oder BIC.
Zu Effektstärken gibt es eine Menge Literatur. Man kann aus einem R² Cohen’s f² berechnen, z. B. hier:
https://www.danielsoper.com/statcalc/calculator.aspx?id=5
Sie können beschreiben, wie f² ansteigt, wenn der Moderatorterm aufgenommen wird.
Inzwischen arbeite ich schon eine Weile mit R und dem ggplot2-Paket und ziehe das gegenüber Excel vor.
Neuer Beitrag zur Visualisierung von Regressionsmodellen, inklusive Interaktionseffekten, Regressionsdiagnostik und 3D-Darstellung:
Regressionsmodelle visualisieren in R (ggplot2, plotly)
Hallo Wolf,
ich bin glaube ich gedanklich noch nicht so weit wie der Rest hier. Ich habe eine Umfrage erstellt mit einer 5-stufigen Likert Skala. 15 Fragen zum Thema Bewertung einer Führungskraft entlang eines Ideals, 6 Fragen zum Respekt ggü der Führungskraft. Der Moderator (auch 15 Fragen) ist die Eigenbewertung des Mitarbeiters über sich selbst über die Kriterien, die bereits bei der unabhängigen Variable genutzt wurden. Und ich würde eben gerne untersuchen, ob der Zusammenhang zwischen der Wahrnehmung der aktuellen Führungskraft als ideale Führungskraft und dem Respekt gegenüber dem aktuellen Vorgesetzten umso größer ist je mehr sie Eigenbewertung des Mitarbeiters der idealen Führungskraft entspricht. Muss ich nun mehrere Regressionen rechnen um die Tabelle von Jeremy Dawson füllen zu können? Die unteren 5 Zeilen sind klar, aber ich hab keine Ahnung was ich machen muss. Oder bin ich völlig auf dem falschen Weg?
Unstandardised Regression Coefficients:
Independent variable:
Moderator:
Interaction:
Intercept / Constant:
Means / SDs of variables:
Mean of independent variable:
SD of independent variable:
Mean of moderator:
SD of moderator:
Vielen Dank für deine Hilfe.
Hallo Sabine,
wenn Du nicht sehr viele Modelle aufstellen willst, solltest Du die Items zu Skalen zusammenfassen. Z. B., indem Du den Mittelwert der entsprechenden Items berechnest. Davor empfiehlt es sich, zu testen, ob bzw. wie gut die Items zusammenpassen: mit Korrelationen und am besten auch Reliabilitätsanalysen. Evtl. musst Du Items umpolen, falls sie inhaltlich in entgegengesetzte Richtungen weisen. (z. B. Zufriedenheit mit x von 1 bis 5 (5 = sehr zufrieden) vs. Unzufriedenheit mit y von 1 bis 5 (5 = sehr unzufrieden).
Dann die Moderatorvariable (Skala) mit der unabhängigen Variable (Skala) multiplizieren und diese neue Variable als Moderatorterm ins Modell mit aufnehmen.
Hallo Herr Riepl,
Vielen Dank für die Erklärung.
Ich habe bei meiner Bachelorarbeit die Interaktionen einmal mit den standardisierten Werten gemacht und einmal ohne, diese Interaktionen sehen aber teilweise nicht ähnlich aus. Kann das sein oder müsste der Moderatoreffekt (also die beiden Linien) ungefähr gleich aussehen?
Außerdem kreuzen die Linien sich jetzt über der X-Achse da sie ja standardisiert sind, das sieht zwar nicht schön aus, ist aber nicht zu ändern oder? Die X-Achse sollte schon bei null bleiben denke ich?
Vielen Dank im Voraus und Viele Grüße
Viki
Hallo Viki,
ja, es ist normal, dass Interaktionen mit standardisierten Werten ein wenig anders aussehen. Immerhin werden dabei ja Effekte unterschiedlich großer Skalen ausgeglichen.
Ich denke es ist nicht störend, wo die Linien sich kreuzen. Wichtig wäre mir vor allem zu zeigen, dass die Linien nicht parallel verlaufen – das ist das wesentliche Kennzeichen des Interaktionseffekts.
Viele Grüße,
Wolf
Super vielen Dank
Lieber Herr Riepl,
vielen Dank für die tolle und anschauliche Erklärung! Ich hätte mal eine Frage zur Moderation innerhalb von Varianzanalysen: Ich möchte eine Moderation rechnen, allerdings ist mein Moderator metrisch. Muss ich diesen Moderator dummy-codieren, um ihn in die Varianzanalyse einfließen zu lassen oder gibt es da auch einen anderen Weg (da die Variable 5 stufig ist, wird die Interpretation des Moderators als Dummy nämlich bestimmt alles andere als einfach).
Besten Dank und viele Grüße
Anna
Hallo Anna,
die Herausforderung liegt nicht im Moderator, sondern in der fünfstufigen Variable. Vorschlag: Regression, vier Dummyvariablen für vier Faktorstufen, die fünfte Stufe kommt nicht ins Modell und dient als Referenzkategorie. Jede der vier Stufen kannst Du mit dem metrischen Moderator multiplizieren, um die Interaktionsterme zu erhalten.
Mehrere Interaktionsterme in einem Modell sind allerdings sehr schwer zu interpretieren. Ich würde separate Modelle mit jeweils nur einem Moderator verwenden. Interpretation eines signifikanten Moderatorterms: Der Effekt der Stufe x im Vergleich zur Referenzkategorie fällt unterschiedlich aus je nach Ausprägung des Moderators.
Hallo Herr Riepl,
haben Sie tausend Dank für Ihre schnelle und ausführliche Antwort! Entschuldigung, ich hab mich falsch ausgedrückt! Nicht die Variable ist fünfstufig, sondern der Moderator. Meine unabhängige Variable in der Varianzanalyse ist dichotom (zwei Gruppen) und die unabhängige Variable ist metrisch. Der MODERATOR ist fünfstufig (entschuldigen Sie, da hab ich mich wirklich falsch ausgedrückt)! Ich würde also gerne einen Interaktionseffekt aus meiner unabhängigen Variable (dichotom) und dem Moderator (fünfstufig) berechnen – da wäre also die Frage, ob ich den Moderator einfach dummy-codieren (vier Dummyvariablen, eine Referenzkategorie) kann und dann mit ins Modell einfließen lasse?!
Vielen Dank und Entschuldigung für die missverständliche Beschreibung
Anna
Hallo Anna,
ich denke, in dem Fall ist es ähnlich. Ja, dummy-codieren. Ein Modell mit mehreren Interaktionstermen ist auch so schwer zu interpretieren. Stehen die fünf Stufen für eine bestimmte Reihenfolge? Dann könnte man überlegen, bei einer bestimmten Schwelle (Verteilungen beachten, sodass ausreichende Gruppengrößen entstehen; es muss natürlich auch inhaltlich sinnvoll sein) in hoch und niedrig zu unterscheiden. Wenn allel fünf Stufen wichtig sind, würde ich es mit separaten Modellen versuchen.
Das ist eine super Idee! Die fünf Stufen stehen für „stimme überhaupt nicht zu“ bis „stimme voll und ganz zu“! Eine Unterteilung in zwei Stufen könnte ich auf jeden Fall mal ausprobieren! Haben Sie vielen Dank für die Antwort! Ansonsten sind die separaten Modelle wohl wirklich die beste Lösung!
Beste Grüße und vielen Dank noch mal
Anna
Hallo Herr Riepl,
entschuldigen Sie, ich noch mal 😉 Ich habe eine ganz kurze Nachfrage, da ich gerade versuche, Ihren Vorschlag, meine fünfstufige Variable in eine zweistufige Variable umzuformen, umsetzen möchte.
Dabei ist mir aufgefallen, dass ich nicht nur die Stufen „stimmt nicht zu“ und „stimmt zu“ umcodieren kann, sondern die Ausprägung „3“ noch bedenken muss, die ja „unentschieden“ bedeutet und sich somit weder zur 1 „stimme nicht zu“ noch zur 2 „stimme zu“ zuordnen lässt. Wenn ich nun meine fünfstufige Variable in eine dreistufige Variable, 1 „stimme nicht zu“, 2 „mittel“ und 3 „stimme zu“ umforme, darf ich dann diese Variable noch als Moderator in das Set der unabhängigen Variable in meine Varianzanalyse nehmen? Oder kann ich dann eine Dummy-Codierung dieses dreistufigen Moderators nicht umgehen?
Haben Sie besten Dank für Ihre Hilfe
Anna
Ich würde mir die Verteilungen ansehen und dann zwei Gruppen bilden. Z. B. „Stimme zu“ vs. „Unentschieden / stimme nicht zu“.
Hallo Herr Riepl,
Ich habe eine Frage zur z-Standardisierung eines dichotomen Moderators. Ich habe bereits einiges zur z-Standardisierung gelesen und bin mir jetzt nicht sicher, ob das in meinem Fall sinnvoll wäre oder nicht.
Konrekt: mein Prädiktor ist Gewissenhaftigkeit (kontinuierlich), mein potentieller Moderator ist Arbeitslosigkeit (dichotom) und das Kriterium ist Lebenszufriedenheit (kontinuierlich). In meiner Statistik Vorlesung habe ich gelernt, dass man Prädiktor und Moderator am besten z-standardisiert. Wie ich in einem Buch (Hayes : Introduction to Mediation, Moderation and Conditional Process Analysis) gelesen habe, ändert eine z-Standardisierung nichts am Ergebnis für den Interaktionsterm, sondern es geht dabei vielmehr um die Interpretierbarkeit der Moderation. Jetzt habe ich Bedenken, dass eine z-Standardisierung von Arbeitslosigkeit dazu führt, dass ich das ganze weniger gut interpretieren kann, daher würde ich eher nicht standardisieren.
Wie ist Ihre Meinung denn dazu?
Liebe Grüße,
Christine
Hallo Christine,
bei dichotomen Merkmalen halte ich eine z-Standardisierung nicht für sinnvoll.
Viele Grüße & viel Erfolg!
Wolf Riepl
Hallo, ich hoffe hier ist noch wer aktiv…
ich untersuche zZ den Zusammenhang von versch. Lerngelegenheiten(UV) mit dem daraus folgenden Wissenscore (AV, intervallskaliert). Dabei werden Kontrollmerkmale eingebracht (Berufswunsch ja/nein; absolvierte Ausbildung ja/nein; Intelligenz intervallskaliert). Ein positiver Einfluss von Anzahl der Lerngelegenheiten auf Wissen wird erwartet. Nun könnte ich doch einfach eine Regression berechnen und die 3 Merkmale zur Kontrolle mit einbringen.
Hintergrund: Ich benötige min. 3 Hypothesen (max 5). Da ich nur 2 versch Lerngelegenheiten a und b habe kann ich ja nur 2 Hypothesen aufstellen.
Var1 (nicht ausreichend)
H1 Anzahl LGa wirkt positiv auf Wissen
H2 Anzahl LG2 wirkt positiv auf Wissen
jeweils unter Hinzunahme der 3 Kontrollvariablen.
Nun bekam ich den Tip das mit Mediatoreffekten zu machen, weil ich so mehr Hypothesen aufstellen könne(?).
Aktuelle Studien konnten zeigen dass Intelligenz in diesem Fall nicht so sehr wirkt, so könnt ich das begründet weg lassen.
Außerdem hat die Ausbildung wohl den größten Effekt weshalb ich bei LGb auch nur diese mit einbeziehen würde.
Var2 (machbar?)
H1.1 Anzahl LGa wirkt positiv auf Wissen (normale Regression)
H1.2 Anzahl LGa*Berufswunsch wirkt positiv auf Wissen (Moderatoreffekt)
H1.3 Anzahl LGa*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)
H2.1 Anzahl LGb wirkt positiv auf Wissen (normale Regression)
H2.2 Anzahl LGb*Ausbildung wirkt positiv auf Wissen (Moderatoreffekt)
Das ganze auf 30 Seiten Bachelorarbeit.
Wie seht ihr das?
Hallo Dirk,
meinst Du Moderator- oder Mediator-Effekt? Das sind unterschiedliche Modelle und unterschiedliche Hypothesen. Oben steht Mediator, unten Moderator. Die Hypothesen passen zu Moderator-Effekten.
Ja, hört sich gut an.
Formulierungsvorschlag:
Anzahl LG (gilt für a und/oder b) wirkt unterschiedlich auf Wissen je nach Ausbildung bzw. Berufswunsch.
Viel Erfolg!
Wolf
Lieber Wolf,
besten Dank für die einfache und gut erklärte Darstellung der Moderationseffekte! Ich hatte in der Tat anfangs gar keinen Plan gehabt, wie ich die Interaktionen richtig interpretieren soll! Toll gemacht!
LG aus NRW,
Tati
Hallo Wolf,
danke für dein aufschlussreiches Video. Ich hätte eine Frage zu einem Untersuchungsdesign, das etwas komplizierter ist.
Ich habe zwei intervallskalierte UV (zB: Intelligenz und Arroganz) und eine Gruppenvariable mit Gruppen (zB. Unter-, Mittel- und Oberschicht). Meine AV wäre intervallskaliert (zB. Anzahl Fotos Instagram).
Erhalte ich nun einen, zwei oder drei Interaktionsterme und wie interpretiere ich das Ergebnis?
Vielen Danke für deine Hilfe.
Patrick
Hallo Patrick,
das ist in der Tat kompliziert. Hast Du denn Hypothesen zu allen Interaktionen? Ich würde mir die Interaktionen einzeln anschauen, d. h. ein Interaktionsterm pro Modell (sowie die Haupteffekte, d. h. die UVs, die die Interaktion bilden, auch einzeln in das Modell aufnehmen). Wenn Du die Gruppenvariable nicht sehr grob als (quasi-)metrisch auffassen willst, musst Du mit Dummyvariablen arbeiten, d. h. 0/1-Codierung. Ich würde dann eine Gruppe mit allen anderen vergleichen. Z. B. Gruppenvariable Unterschicht, 1=Unterschicht, 0=keine Unterschicht. Gibt es eine Interaktion, dann unterscheidet sich die Steigung der Regressionsgeraden zwischen Unterschicht und „Nicht-Unterschicht“.
Ich weiß nicht, ob sich ein Gesamtmodell mit mehreren Interaktionstermen sinnvoll interpretieren lässt. Für jeden Term müsste gelten „wenn alle anderen Modellvariablen konstant gehalten werden“.
Also generell: So einfach wie möglich, so komplex wie nötig. Ich bezweifle, dass es „nötig“ ist, alle Interaktionen in ein Modell zu werfen und dann exakt zu interpretieren …
Viel Erfolg!
Vielen Dank für die schnelle Antwort. Ich möchte ein großes Modell haben und habe insgesamt 4 Prädiktoren und zwei Interaktionsterme, die unter Berücksichtigung der Literatur sinnvoll wären. Die Prädiktoren und Interaktionsterme würde ich dann gerne hierarchisch aufnehmen.
Ich glaube, dass ich mir noch mal den Bühner/Ziegler vornehme und mit meinem Prof. berate.
Danke für die Erklärung.
Hallo,
ich habe ähnlich wie Deleno einen metrischen Moderator, während der andere UV kategorial ist. AV ist metrisch. Ich habe vor der Analyse metrischen Variablen standardisiert, die kategoriale Variable (3 Stufen) dummycodiert. Ich habe auch die Grafik erstellt, die jedoch gleich ist mit deiner – bei dir fungiert jedoch der kategoriale Prädiktor als Moderator. Ist es falsch, wenn ich gleiche Grafik verwende und sage, dass die metrische Variable der Moderator ist, wobei der auf der x-Achse abgebildet ist?
Tausend Dank im Voraus!
Lena
Hallo Lena,
klingt erst mal vernünftig. Kannst Du das Ergebnis interpretieren, sodass es inhaltlich sinnvoll ist und zur Grafik passt? Dann denke ich passt es.
Hallo,
vielen Dank für die gute Erklärung!!! Kann es eigentlich Probleme geben, wenn ich einen dichotomen Moderator (0 und 1) habe, wo die Stichprobengröße verschieden ist? Also wenn N = 600 für Ausprägung 0 und N = 2000 für Ausprägung 1 betragen. Oder wird das durch Gewichtung und Z-Standardisierung (der UV, nicht der Dummyvariable) ausgeglichen?
Lieben Gruß
Joleena
Hallo Joleena,
ich verstehe es so: Die Stichprobengröße ist N=(2000+600)=2.600.
Bei einem dichotomen Merkmal wird man nur in seltenen Fällen eine genaue Gleichverteilung der beiden Ausprägungen erreichen. Prinzipiell und in Deinem Beispiel halte ich das für völlig unproblematisch. Schwierig wird es nur, wenn eine Ausprägung sehr schwach besetzt ist. Z. B. 10 mal die 0 und 2590 mal die 1. Dann wären die Ergebnisse nicht besonders belastbar. Aber bei 600 / 2000 sehe ich da kein Problem.
Ungleiche Gruppengrößen kann man natürlich durch Gewichtung ausgleichen. Das könnte sinnvoll sein, wenn „in Wirklichkeit“ (in der Grundgesamtheit) die Verteilung des dichotomen Merkmals ausgeglichen ist (50/50). Das muss nicht so sein.
z-Standardisierung passt hier meines Erachtens nicht. Die ist sinnvoll, wenn man verschiedene Merkmale hat, die auf unterschiedlichen Skalen gemessen wurden, z. B. Alter in Jahren, Länge in Zentimetern usw. Dann hat „eine Einheit“ je nach Merkmal eine ganz unterschiedliche Bedeutung. Ohne Standardisierung können Merkmale mit „großen“ Skalen einen größeren Einfluss auf die Ergebnisse ausüben als Merkmale mit „kleinen“ Skalen.
Hallo,
kurz eine Frage zum Interaktionseffekt:
Im Interaktionsterm in der Regression wird nur die Gruppe analysiert, die als UV mit dem Wert 1 kodiert ist oder?
Also wenn z.B.
UV=Migration –> 0=kein Migrationshintergrund und 1=Migrationshintergrund
Moderator= Einkommen (metrisch: hohe Werte= hohes Einkommen)
Dann wäre die Interpretation des Interaktionseffektes: je reicher ein Migrant desto…
Kann man irgendwie auch untersuchen, wie sich hohes Einkommen bei Personen ohne Migrationshintergrund auswirken würde?
Vielen Dank
Hallo Deleno,
es geht um eine Wechselwirkung. Also nicht: Je reicher, desto, … Sondern: Bei höherem Einkommen wirkt der Migrationshintergrund anders auf die AV als bei niedrigem Einkommen.
Vielleicht fällt die Interpretation leichter, wenn Du den Migrationshintergrund als Moderator betrachtest? Formulierungsvorschlag: Mit Migrationshintergrund wirkt das Einkommen anders auf die AV als ohne Migrationshintergrund.
Hmm..aber könnte der Interaktionseffekt dann nicht so interpretiert werden:
Je höher das Einkomen, desto zufriedener sind Migranten? (wenn Einkommen einen positiven Effekt hat)
Versuch es mal einfach:
Wie ist die Korrelation zwischen Einkommen und Zufriedenheit (das ist wohl die AV) insgesamt?
Und dann getrennt für Migranten und Nicht-Migranten: Wie ist da jeweils einzeln die Korrelation zwischen Einkommen und Zufriedenheit? Unterscheiden sich die Korrelationskoeffizienten?
Hallo,
danke erstmal für die gute Erklärung!
Ich habe eine Frage zu dem Video. Wie würde nun die Regressionsgleichung für das Modell mit dem Interaktionseffekt (03:50 Minuten) aussehen, wenn ich den Lernerfolg voraussagen möchte?
Bleibt der Term Lernstunden in dem Regressionsmodell, obwohl es nicht signifikant (0.199) ist oder wird der Term entfernt und das Modell erneut berechnet?
Vielen Dank
Hallo Philipp,
ich würde die Lernstunden drinlassen. Das Besondere an den Interaktionseffekten ist ja, dass der Effekt der Lernstunden nicht mehr nur in dem Prädiktor Lernstunden steckt, sondern auch zum Teil in dem Interaktionsterm Lernstunden * Entspannungstechnik, der signifikant ist. D. h. diese beiden Terme sind nicht von einander unabhängig; beide „gehören“ zum Modell.
Viel Erfolg mit Deinen Analysen!
Wolf
Super, vielen Dank!
Kennst Du eine Literaturquelle die das „Problem“ beschreibt?
Mediator- und Moderatoranalyse: How to do (PDF)
Danke!
Ich habe folgendes Paper gefunden:
http://pan.oxfordjournals.org/content/14/1/63.short
Im Abschnitt 3 wird erklärt, weshalb die einfachen Terme im Modell bleiben sollten.
Lieber Herr Riepl,
vielen Dank für diese hilfreiche Seite!
Ich habe das Moderatormodell für meine Masterarbeit mit SmartPLS (standardisiert) aufgestellt und folgende Ergebnisse erhalten:
-Der Interaktionsterm von Enjoyment*Age hat einen Effekt von 0.07 auf Behavioral Intention (BI)
-Enjoyment als unabhängige Variable in dem Modell hat einen Effekt von 0.47.
–> Soll heißen, bei mittlerem Alter (in meinem Fall 36 Jahre), hat Enjoyment einen Effekt auf BI in Höhe von 0.47, bei einem Alter 36 hat es einen verstärkten Effekt in Höhe von 0.54. Ist diese Interpretation so korrekt?
-Außerdem habe ich noch 6 weitere Interaktionsterme mit in das Modell aufgenommen, die allerdings alle nicht signifikant sind. ich soll die nicht-signifikanz jetzt in meiner Diskussion kritisch hinterfragen. Haben Sie hierzu zufällig Literaturvorschläge? Mein Betreuer sagt, dass die Begründung „der Effekt ist unabhängig von der Ausprägung der Moderationsvariablen“ nicht genügt und ich frage mich, ob es vielleicht Quellen gibt, die besagen, dass die Herangehensweise mit Interaktionstermen generell fragwürdig ist, 7 Interaktionsterme zu viel sind o.Ä.
Vielen Dank vorab!
LG
Paula
Hallo Paula,
> Soll heißen, bei mittlerem Alter (in meinem Fall 36 Jahre), hat Enjoyment einen Effekt auf BI in Höhe von 0.47, bei einem Alter 36 hat es einen verstärkten Effekt in Höhe von 0.54. Ist diese Interpretation so korrekt?
Sie haben 2x von 36 Jahren geschrieben. Interpretationshilfe: einen oder mehrere „fiktive“ Fälle aufstellen (mit ausgewähltem Alter etc.; alle Modellvariablen müssen Werte haben, das können ansonsten die Mittelwerte sein) und mit dem Modell Vorhersagen für diese Fälle machen. (Mit SmartPLS habe ich keine Erfahrung.)
Ich finde Modelle mit mehreren Interaktionstermen sehr schwer interpretierbar, da es sehr viele Wechselwirkungen zwischen Variablen gibt. Sobald Variablen korrelieren, beeinflusst das die Koeffizienten. Bei Interaktionstermen und einzelnen UVs gibt es zwangsläufig Korrelationen. Ich würde für jeden Interaktionsterm ein separates Modell aufstellen – zumindest zum Vergleich. Das lässt sich klarer interpretieren.
Bin schon ziemlich lange aus unibezogener Forschung raus und habe keine Literaturquelle dazu zur Hand …
Besten Dank für die schnelle Antwort!
Bei meiner ersten Frage sind ein paar Worte abhanden gekommen. Ich schreibe meinen Sachverhalt nochmal etwas verständlicher auf:
Soll heißen bei folgendem Ergebnis
X –> Y b=0.6
Z*X —> Y b=0.1.
Z —-> Y b=-0.05, mit Z als metrische Variable mit Mittelwert 0
gilt für
Z gleich 0 X —-> Y b=0.6
Z gleich 1 X —-> Y b=0.7
Z gleich 2 X —-> Y b=0.8
Z gleich -1 X —-> Y b=0.5
Z gleich -2 X —-> Y b=0.4
oder etwa
Z gleich 0 X —-> Y b=0.6
Z größer als 0 X —-> Y b=0.7
Z kleiner als 0 X—-> Y b=0.5
Ich bin mir nicht sicher, welche Interpretation richtig ist.
Viele Grüße
Paula
Ich würde ganz konkrete Werte einsetzen (auch für X) und damit rechnen. Das müsste auch das Programm können, vielleicht als neuer Datensatz mit „fiktiven“ Probanden, für die man Werte der unabhängigen Variablen (inkl. Moderator) einträgt. Darauf dann das Modell anwenden und die AV vorhersagen lassen.