Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?

SPSS: Ausschnitt aus der Testauswahl im Menü "Analysieren"

Die Universität Zürich bietet eine empfehlenswerte Hilfestellung bei der Auswahl des geeigneten statistischen Tests bzw. der passenden multivariaten Analysemethode. In einem Entscheidungsbaum sind Unterschiedstests und Verfahren für Zusammenhangs- und Interdependenzanalysen dargestellt; farbliche Abstufungen berücksichtigen das Skalenniveau (nominalskaliert, ordinalskaliert oder intervallskaliert); zusätzlich wird auch dargestellt, ob normalverteilte Daten vorausgesetzt werden oder ob es sich um ein verteilungsfreies (nichtparametrisches) Verfahren handelt:

Entscheidungshilfe zur Auswahl des geeigneten statistischen Tests

Zusätzlich gibt es noch einen interaktiven „Entscheidassistent„, bei dem man mit Fragen Schritt für Schritt und Klick für Klick zur geeigneten statistischen Methode geführt wird.

Zu speziellen Entscheidungsfragen siehe folgende Beiträge:

Korrelation: Pearson vs. Spearman
T-Test oder U-Test?
Signifikanztests bei Kreuztabellen: Kategorien sinnvoll zusammenfassen (behandelt den Chi-Quadrat-Test)

Motivationshilfe: Warum Statistiker der beste Job der Welt ist



Bei Fragen steht Ihnen selbstverständlich auch der Statistik-Berater Ihres Vertrauens zur Verfügung 😉

Hier gibt es Anregungen für die Visualisierung statistischer Daten.

Literatur:
Inferenzstatistik Verstehen: Von A wie Signifikanztest bis Z wie Konfidenzintervall (Springer-Lehrbuch Masterclass) (German Edition)
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (Springer-Lehrbuch)






25 Gedanken zu „Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?“

  1. Hallo Herr Riepl,

    auf der Suche nach statistischen Methoden, die ich für meine Abschlussarbeit verwenden kann, bin ich auf Ihrer Seite gelandet. Ich hoffe Sie können mir ein wenig weiterhelfen bei der Auswahl der Methode(n).
    In meiner Arbeit untersuche ich die Arbeitgeberattraktivität der Gesundheitsbranche und habe dazu über einen Online-Fragebogen die Daten erhoben. Die meisten Daten sind nominalskaliert und univariat, diese würde ich mit einfacher deskriptiver Statistik darstellen. Jedoch habe ich insgesamt 5 Fragebogenitems mit einer fünf-stufigen Likert-Skala, hier würde ich die Mittelwerte berechnen und über einen T-Test überprüfen, ob die Mittelwerte signifikant verschieden sind. Die Skalen sollen jedoch mit den Daten des Geschlechtes kombiniert werden, ist dies so möglich?
    Eine weitere Frage ist mit welcher Methode ich von meiner Stichprobe auf die Grundgesamtheit schließen kann?

    Wie sie wahrscheinlich gemerkt haben bin ich statistisch ziemlich ahnungslos, deshalb verzeihen Sie mir bitte mögliche Fehler.

    Vielen Dank schon einmal im Voraus,
    Marcel S.

    1. Hallo Marcel,

      bei mehr als zwei Einzelvergleichen würde ich Varianzanalyse gegenüber t-Test bevorzugen. Bei mehreren Tests steigt die Wahrscheinlichkeit, dass mal „zufällig“ ein signifikantes Ergebnis dabei ist. Deshalb sollte der gesamte Hypothesenkomplex auf dem gewünschten Alpha-Niveau abgesichert werden. Salopp gesagt: Ein t-Test weiß nichts von den anderen t-Tests; in der Varianzanalyse kann man mehrere Einzelvergleiche zusammenfassen.
      Geschlecht mit berücksichtigen: Kommt drauf an, wie die Hypothesen lauten. Man kann für jeweils ein Item (oder eine Skala) die Geschlechter vergleichen: t-Test für unabhängige Stichproben. Oder Geschlecht als Kontrollvariable in einem komplexeren Modell, z. B. Varianz- oder Regressionsanalyse.

      Schluss von der Stichprobe auf die Grundgesamtheit: Das ist im Grunde die Idee hinter allen Signifikanztests, also keine Frage einer ganz bestimmten Methode. Neben der Statistik gehören Überlegungen dazu, wie die Grundgesamtheit definiert ist und ob die Stichprobe diese abbildet. Sind relevante Merkmale in der Stichprobe ähnlich verteilt wie in der Grundgesamtheit? Handelt es sich um eine Zufallssstichprobe? Etc.

      Eine detaillierte Betreuung kann ich in nächster Zeit leider nicht leisten, bin mit Projekten ausgelastet.

      Viele Grüße!

      Wolf

  2. Hallo,

    ich bin momentan auf der Suche nach dem geeigneten statistischen Testverfahren, um verschiedene Bedingungen innerhalb einer Stichprobe miteinander zu vergleichen.
    Es geht um eine recht kleine Stichprobe von ca. 20 Teilnehmern, die verschiedene Objektbewegungen auf einem Computerbildschirm identifizieren sollen.
    Vergleichen möchte ich dann Unterschiede in Genauigkeit der Antworten was zum Beispiel große und kleine Distanzen oder rechts und links angeht.
    Es handelt sich immer um eine Entscheidung zwischen: Ja, es hat eine Bewegung stattgefunden und Nein, es gab keine Bewegung.

    Da ich bisher wenig Erfahrung mit statistischer Auswertung habe, würde ich mich über einige Denkanstöße bezüglich der Auswahl eines geeigneten Verfahrens sehr freuen.

    Vielen Dank!

    1. Hallo Josefine,
      die kleine Stichprobe spricht meines Erachtens für nichtparametrische Verfahren. Bei Messwiederholung und dichotomem Merkmal (wie ja/nein) passt evtl. der McNemar-Test?

      1. Guten Morgen,

        vielen Dank für die schnelle Antwort! Nachdem ich alles noch einmal überdacht habe, ist mir aufgefallen, dass die Antwortmölichkeiten zwar ja/nein sind, die Anzahl der richtigen/falschen Antworten jedoch eine ganzzahlige Zahl sein wird, die normalverteilt ist. Aus diesem Grund tendiere ich zum momentanen Zeitpunkt zum t-test für eine einzige Stichprobe ohne Messwiederholungen. Auf diesem Wege müsste ich die beiden Bedingungen, die ich jeweils gegenüberstellen möchte mit einem Erwartungswert vergleichen können. Ist das richtig, oder denken Sie, dieser Test ist ungeeignet?
        Beste Grüße,
        Josefine

        1. Guten Morgen Josefine,
          hört sich gut an, Anmerkungen:
          Werden zwei Bedingungen verglichen, für die Sie eigene Daten haben? Jeder Teilnehmer hat jede Bedingung absolviert? t-Test für abhängige Stichproben (Messwiederholung)
          Vergleich zweier Bedingungen, wobei einige Teilnehmer Bedingung A absolviert haben, einige Bedingung B: t-Test für unabhängige Stichproben
          Vergleich einer Messung (Variable, Spalte) aus ihren Daten mit einem Erwartungswert, der nicht aus ihrem Datensatz stammt: t-Test für eine Stichprobe

          Bitte beachten: Wenn Sie sehr viele t-Tests durchführen, dann steigt die Wahrscheinlichkeit, zufällig ein signifikantes Ergebnis zu erzielen – Fachbegriff Alpha-Fehler-Kumulierung. Auf der verlinkten Webseite gibt es eine Anleitung, wie man manuell das Signifikanzniveau anpassen kann: p-Wert durch Anzahl der Einzelvergleiche teilen. Um der Alpha-Fehler-Kumulierung entgegenzuwirken, gibt es bei Varianzanalysen die Post-Hoc-Tests.

  3. Hallo Herr Riepl,

    ich hoffe Sie können mir bei meiner Methodenauswahl ein wenig behilflich sein, meine Dozentin ist momentan nicht erreichbar und Ich bin nicht so fit auf diesem Gebiet, da wir es in der Hochschule nie wirklich gelernt haben.

    Ich habe schon ein wenig Vorarbeit geleistet und meine Daten per Häufigkeitsverteilung, Mittelwert, etc. genauer betrachtet. Ich habe auch schon eine Faktorenanalyse durchgeführt um zu sehen welche Variablen für die FA geeignet sind.
    Jetzt geht es darum wie ich meine Hypothesen, mit welchen Methoden auswerten kann.
    Leider ist es so dass meine Dozentin von der Hochschule zwei Tests unbedingt haben möchte.
    2 multivariate Hypothesen anhand 2 multivariate Tests prüfen – Clusteranalyse, Regressionsanalyse mit Mediator oder Moderator oder Varianzanalyse mit oder ohne Messwiederholung.

    Welche Tests kann ich für welche Hypothese verwenden und sind meine Hypothesen überhaupt geeignet für für diese multivariaten Tests?

    Zuerst zu meinen Hypothesen:

    H1: Auf den einzelnen Social Media Plattformen sind mehr weibliche, als männliche Nutzer angemeldet.
    H2: Frauen sind prinzipiell zufriedener als Männer, in Bezug auf Social Media Plattformen.
    H3: Singles sind pro Tag länger auf Social Media Plattformen unterwegs, als Personen die in einer Beziehung bzw. verheiratet sind.
    H4: Männer wünschen sich weniger Werbeanzeigen auf Social Media Plattformen, als Frauen.
    H5: Jüngere Social Media Nutzer finden Werbeanzeigen interessanter, als Nutzer die älter als 30 Jahre sind.

    Stichprobengröße: n=212
    Thema: Social Media, Werbeanzeigen

    Können Sie mir bei meinem Problem helfen?
    Vielen Dank.

    Viele Grüße
    Sabrina

    1. Hallo Sabrina,
      danke für Ihre Nachricht!
      Ihre Hypothesen kann man bivariat testen, d. h. sie setzen jeweils zwei Variablen in Beziehung. Für multivariate Tests brauchen Sie mindestens drei Variablen.
      Clusteranalysen würde ich ausschließen, wenn Sie nahe an den bisherigen Hypothesen bleiben wollen – das ist ein exploratives Verfahren, bei dem man Gruppen bildet, d. h. es gibt keine Unterscheidung in abhängige und unabhängige Variablen. Regressionsanalysen oder Varianzanalysen sind besser geeignet, um ihre Hypothesen auf multivariate Anwendung zu erweitern.
      Für Messwiederholungen bräuchten Sie passende Daten. Die Hypothesen klingen eher nach Daten, die nur zu einem bestimmten Messzeitpunkt erhoben wurden. (Man kann allerdings auch den Vergleich verschiedener Social Media-Plattformen als Messwiederholungen modellieren.)

      Beispiel für eine multivariate Hypothese:
      Unter Kontrolle des Alters sind Frauen zufriedener als Männer in Bezug auf Social Media-Plattformen.
      Diese Hypothese können Sie mit Regressions- und Varianzanalysen testen.

      Moderator: Wechselwirkung, d. h. der Effekt einer Variable auf eine andere ist unterschiedlich je nach Ausprägung des Moderators.
      Mediator: Eine Drittvariable „vermittelt“ den Zusammenhang zwischen zwei anderen Variablen.

      1. Vielen Dank Wolf, dass du mir so schnell geholfen hast. Es ist manchmal echt schwierig herauszufinden welcher Test für welche Variablen geeignet ist. Das ist glaube ich für die meisten das schwierigste.
        Viele Grüße
        Sabrina

  4. Hallo,

    ich hoffe sehr auf Ihre Hilfe mit Methodenauswahl für meine Analyse.

    Ich habe folgende Daten:
    1. Ein Wert (eine abhängige Variable) für ca. 200 Unternehmen für Jahre 2004-2015. Für jedes Jahr gibt’s Daten für ca. 200 Unternehmen.

    2. Mehrere unabhängige Variablen (über 20), die die obengenannte abhängige Variable beeinflussen. Daten gibt’s auch für den Zeitraum 2004-2015 und für ca.200 Unternehmen.

    3. Einige unabhängige Variablen, die später als 2004 eingeführt wurden und die es nicht für alle Unternehmen gibt.. Manche wurden 2008 eingeführt (dann ist der Zeitraum für diese Variablen 2008-2015), andere 2012 (2012-2015) usw.

    Nun habe ich ein paar Fragen:
    1. Wie kann man analysieren, wie groß der Einfluss von jeder der unabhängigen Variable (s.o. Punkt 2) auf die abhängige Variable für die gesamte Zahl der Unternehmen ist?

    2. Kann man Analysieren, ob die Aufnahme neuer Variablen in den Datensatz (s.o.Punkt 3) einen Einfluss auf die abhängige Variable hat? Und wenn ja, wie groß dieser Einfluss wäre?

    Ich hoffe sehr auf Ihre Antwort! Würde mich auf jede Rückmeldung freuen!

    Vielen Dank!
    MfG
    Karelia P.

    1. Guten Abend Karelia,

      ja, das geht, aber es ist sehr fortgeschritten. Stichworte: Panelanalyse, GEE-Modelle (GEE = Generalized Estimating Equations).

      Viele Grüße,

      Wolf

      1. Vielen lieben Dank für Ihre rasche Antwort!
        Ich probiere die Paneldatenanalyse und schaue, wie die GEE-Modelle aussehen!

  5. Hallo,
    Kenne mich leider statistisch nicht so gut aus und habe folgendes Problem.

    Habe diverse Daten von Banken, die ich in drei nicht überschneidende Banken-Gruppe gegliedert habe. Die Kennzahlen sind entweder von 0-100% oder theoretisch von minus unendlich bis plus unendlich. Eine Gruppe besteht nur aus 5 Teilnehmern.

    Ich möchte jetzt einen Mittelwertvergleich durchführen um signifikante Unterschiedeuu finden. Habe eine einfaktorielle ANOVA ausprobiert mit einem posthoc Test. Bin mir aber nicht sicher ob das richtig ist.

    Was musste man anwenden wenn Normalverteilungoder varianzhomogenität nicht gegeben sind bzw kann man die ANOVA überhaupt für alle oben genannten Tests anwenden?

    Danke jetzt schon für jede Antwort!
    LG Armin

    1. Hallo Armin,
      bei diesen kleinen Fallzahlen würde ich keine Anova nehmen oder wenn es unbedingt sein soll, dann wenigstens zusätzlich nichtparametrisch absichern. Die nichtparametrische Alternative ist der Kruskal-Wallis-Test. Er arbeitet nicht mit den Originalwerten, sondern mit Rangplätzen. Streng genommen macht man damit keinen Mittelwertvergleich, sondern einen Vergleich der „zentralen Tendenz“.
      Neuere SPSS-Versionen bieten auch dafür Post-Hoc-Tests an.
      Viel Erfolg!

      1. Vielen Dank für die Antwort Wolf!

        Ich habe gelesen das Kruskal Wallis Tests Probleme bei ungleichen Varianzen habe und es wurde ein Welch Test empfohlen. Kannst du dem zustimmen und würde das bei meinen Daten sinnvoll sein?

        1. Kruskal Wallis ist meines Wissens eine Alternative, wenn die Anova aufgrund ungleicher Varianzen problematisch ist. Da Kruskal Wallis nichtparametrisch (mit Rangplätzen) arbeitet, geht es nicht um Varianzgleichheit.

          Welch ist meines Wissens eine Korrektur bei t-Tests für ungleiche Varianzen.

          Anders gesagt: Kruskal Wallis müsste noch unempfindlicher gegenüber ungleichen Varianzen sein als t-Tests mit Welch-Korrektur.

  6. Hallo,

    ich versuche aktuell herauszufinden, wie sich die Arbeitsfähigkeit von Mitarbeitern einer Firma innerhalb von fünf Jahren verändert hat und suche dazu den richtigen Test.

    Gemessen wird die Arbeitsfähigkeit mit einem Fragebogen und es liegen insgesamt fünf Messzeitpunkte mit unterschiedlicher Teilnehmeranzahl vor. Nun möchte ich genau wissen, inwieweit sich die einzelnen Messungen unterscheiden und zudem die Ergebnisse anhand von 3 vorher festgelegten Altersgruppen analysieren, also welche Altergruppe sich wie verändert hat. Leider fehlt mir dazu das statistische Fachwissen, um sicher den richtigen Test auswählen zu können und hoffe deshalb hier auf Hilfe.

    Wenn meine Beschreibung verständlich ist, würde ich mich über eine Antwort sehr freuen. Vielen Dank vorab.

    1. Hallo Sven,
      klingt nach Varianzanalyse mit Messwiederholung. Mit welcher Software willst Du das analysieren? In SPSS z. B. unter Allgemeines Lineares Modell – Messwiederholung. Within Subjects: Veränderungen innerhalb der Mitarbeiter im Zeitverlauf; Between Subjects: Unterschiede zwischen Mitarbeitern (z. B. Altersgruppen).
      Die ganze Theorie dazu und die Optionen kann man nicht so kurz beschreiben …
      Viele Grüße!
      Wolf

      1. Hallo Wolf,

        vielen Dank für die rasche Antwort. Ja, ich werte die Daten mit SPSS aus. Nun bin ich dch mit Ihrer Antwort bereits ein Stück weiter gekommen. Da werde ich jetzt ansetzen und mich weiter schlau machen, um die einzelnen Schritte zu verstehen und anwenden zu können. Vielen Dank

        Sven

  7. Hallo ich bin gerade dabei drei Hypothesen zu überprüfen, leider sind meine Kenntnisse nicht sehr gut vor allem da ich nicht weiß welche Tests ich machen soll damit ich diese überprüfen kann.

    Ich hab folgende Hypothesen: Die Sympathie ist für Frauen bei einer Bankberatung wichtig, als wie für Männer
    Zweite: Angebot des Online-Bankings verwenden mehr Frauen als Männer und die Dritte: Männer sind eher unzufrieden mit ihrer Bankberatung als Frauen

    Alle drei Hypothesen hängen mit dem Geschlecht zusammen, ich habe es schon mit dem Mittelwert probiert aber damit kann ich meine Hypothesen nicht wirklich überprüfen. Bei der dritten Hypothese zum Beispiel möchte ich ja wissen wie viele Männer bei der Zufriedenheit des Bankberaters gesagt haben das es voll zutrifft, weniger zu trifft, zu trifft und nicht zu trifft.

    Kann mir jemand dabei helfen und mir sagen mit welchen Tests ich diese drei Hypothesen überprüfen kann?

    1. Hallo Claudia,

      ich fang mal in der Mitte an, weil die zweite Hypothese anders zu testen ist: So wie ich sie verstehe, ist das eine Kreuztabelle aus Online-Banking ja/nein und Geschlecht mit 2×2 = 4 Feldern. Da passt die unten stehende Antwort auf Lisa M.

      Bei der ersten und dritten Hypothese kommt es u. a. auf die Fallzahlen und Verteilungen an. Man könnte für Sympathie und Zufriedenheit schon Mittelwerte nehmen, wenn diese beiden Merkmale annähernd normalverteilt sind (grafische Überprüfung: z. B. Histogramm mit Normalverteilungskurve oder QQ-Plot; statistischer Test: z. B. Shapiro-Wilk). Dann t-Test für unabhängige Stichproben, Geschlecht jeweils als Gruppenvariable. Bei Nicht-Normalverteilung, kleiner Fallzahl und/oder sehr ungleichen Gruppengrößen (Anzahl Frauen vs. Männer) gibt es als Alternative den nichtparametrischen Mann-Whitney-U-Test.

      1. Vielen Lieben Dank für deine schnelle Hilfe.
        Die Kreuztabelle zeigt mir sehr gut wie viele Frauen und Männer was geantwortet haben.

  8. Hey,

    ich bin völlig in ahnungslos in Sachen Statistik und muss jetzt aber mit Spss meine Fragebogendaten auswerten.

    Ich habe folgende hypothese:

    Leistungsorientierte Badmintonspieler halten die Dienst- und Serviceleistungen des DBV für wichtiger als die freizeitorientierten Badmintonvereinsspieler.

    Dazu habe ich in meinen Daten einmal die Angabe zu der Spielorientierung meiner Stichprobe (1=Freizeitorientiert 2=Leistungsorientiert) und zu den jeweilien Dienst- und Serviceleistungen hab ich jeweils die Antwortmöglichkeit (1= sehr wichtig; 2=weniger wichtig)

    Es wäre super, wenn du mir sagen könntest welcher Test der richtige ist um meine Hypothese zu überprüfen. Vielen Dank!

    1. Hallo Lisa,

      mach eine einfache Kreuztabelle. Es gibt hier ja nur 2×2 = 4 Felder. Als Test würde ich den Chi-Quadrat-Test nehmen bzw. bei kleiner Fallzahl (Warnung unter der Tabelle, wenn Zellen eine erwartete Häufigkeit < 5 aufweisen) den exakten Test nach Fisher (beides steht in der Ergebnistabelle). Fisher hat noch den Vorteil, dass ein einseitiger Signifikanzwert angegeben wird. Du hast eine gerichtete Hypothese, da Du angibst, in welche Richtung Du einen Unterschied erwartest. Dadurch kannst Du einseitig testen und wirst mit einem kleineren p-Wert "belohnt". (Im Zweifelsfall Chi-Quadrat und Fisher berichten.) Falls der Unterschied in die andere Richtung weist (freizeitorientierte Badmintonspieler halten die Serviceleistungen häufiger für sehr wichtig), ist die Hypothese unabhängig vom p-Wert widerlegt. Die Nullhypothese lautet: Die relativen (=prozentualen) Häufigkeiten der Antwortmöglichkeiten "sehr wichtig" und "weniger wichtig" hinsichtlich der Serviceleistungen sind in beiden Gruppen der Badmintonspieler gleich. Ein signifikanter p-Wert (kleiner oder gleich 0,05) bedeutet, die Unterschiede sind signifikant. Viel Erfolg! Wolf

Freue mich über Kommentare!