Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?

SPSS: Ausschnitt aus der Testauswahl im Menü "Analysieren"

Die Universität Zürich bietet eine empfehlenswerte Hilfestellung bei der Auswahl des geeigneten statistischen Tests bzw. der passenden multivariaten Analysemethode. In einem Entscheidungsbaum sind Unterschiedstests und Verfahren für Zusammenhangs- und Interdependenzanalysen dargestellt; farbliche Abstufungen berücksichtigen das Skalenniveau (nominalskaliert, ordinalskaliert oder intervallskaliert); zusätzlich wird auch dargestellt, ob normalverteilte Daten vorausgesetzt werden oder ob es sich um ein verteilungsfreies (nichtparametrisches) Verfahren handelt:

Entscheidungshilfe zur Auswahl des geeigneten statistischen Tests

Zusätzlich gibt es noch einen interaktiven „Entscheidassistent„, bei dem man mit Fragen Schritt für Schritt und Klick für Klick zur geeigneten statistischen Methode geführt wird.

Zu speziellen Entscheidungsfragen siehe folgende Beiträge:

Korrelation: Pearson vs. Spearman
T-Test oder U-Test?
Signifikanztests bei Kreuztabellen: Kategorien sinnvoll zusammenfassen (behandelt den Chi-Quadrat-Test)

Motivationshilfe: Warum Statistiker der beste Job der Welt ist

Bei Fragen steht Ihnen selbstverständlich auch der Statistik-Berater Ihres Vertrauens zur Verfügung 😉

Hier gibt es Anregungen für die Visualisierung statistischer Daten.

Literatur:
Inferenzstatistik Verstehen: Von A wie Signifikanztest bis Z wie Konfidenzintervall (Springer-Lehrbuch Masterclass) (German Edition)
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (Springer-Lehrbuch)



57 Gedanken zu „Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?“

  1. Hallo! 🙂
    Ich habe in einem Fragebogen den Zusammenhang zwischen der Angabe persönlicher Informationen und der Teilnahme an Geld-zurück-Garantien untersucht. Mit Geld-zurück-Garantien meine ich die der Aktionsprodukte „Jetzt gratis testen“, d.h. man muss nach dem Kauf eines Produkts z.B. seine Bankdaten und Adresse angeben und dann bekommt man den Kaufpreis vom Unternehmen erstattet.
    Meine Frage im Fragebogen lautete: „Welche der folgenden Gründe würden Sie hindern, die Geld-zurück-Garantie eines Aktionsprodukts geltend zu machen? Mehrfachantworten sind möglich.“
    Es gab folgende Antwortmöglichkeiten:
    Die Angabe meiner Bankdaten (1=nicht ausgewählt, 2=ausgewählt)
    Die Angabe meiner persönlichen Anschrift (1=nicht ausgewählt, 2=ausgewählt)
    keines der beiden (1=nicht ausgewählt, 2=ausgewählt)
    Meine Hypothesen lauten:
    H4: Die Angabe persönlicher Informationen hat Einfluss auf die Teilnahme solcher Geld-zurück-Garantien.
    ∙H4a: Die Angabe von Bankdaten hat Einfluss auf die Teilnahme solcher Geld-zurück-Garantien.
    ∙H4b: Die Angabe der privaten Anschrift hat Einfluss auf die Teilnahme solcher Geld-zurück-Garantien.

    Ich habe folgende Fragen: Handelt es sich hierbei um ungerichtete Zusammenhangshypothesen? Wenn ja, hatte ich überlegt die Ausprägungen (1 und 2) jeder der 3 Antwortmöglichkeiten mit einer selbst erstellten Spalte mittels Spearman Korrelation zu vergleichen (dies ist ja auch mit dichotomen Daten möglich oder?). Also ich wollte eine Spalte erstellen mit 1=Nichtteilnahme (wenn zum Beispiel angeklickt wurde, dass die Angabe der Bankdaten an der Teilnahme hindert) bzw. 2= Teilnahme (wenn zum Beispiel ausgewählt wurde: keines der beiden)

    Liege ich mit meinen Ideen richtig? Oder handelt es sich doch eher um einen Wilcoxon-Vorzeichen-Rang Test als Anpassungstest?

    Liebe Grüße

    1. Hallo Sophia,
      ja, man kann die Hypothesen als ungerichtet bezeichnen. Es gibt allerdings nur jeweils 2 Ausprägungen: ausgewählt oder eben nicht. Das würde ich kategorial analysieren, nicht ordinal (Spearman-Korrelation). Ich sehe allerdings auch nicht, dass man zwei Variablen in Zusammenhang setzen müsste. Im Grunde ist doch die Hypothese widerlegt, wenn die Teilnehmer sich nicht von der Inanspruchnahme der Geld-zurück-Garantie abhalten lassen? Das sieht man doch auch an einfachen Häufigkeitsauszählungen, oder? Um es testbar zu machen, könnte man eine Schwelle festlegen, z. B. wenn mindestens x% der Teilnehmer sich abhalten lassen, dann hat die Angabe persönlicher Infos Einfluss. Drei Tabellen: a) Bankdaten, b) Anschrift; c) mindestens eine der beiden Info-Arten (das wird der höchste Anteil an Personen, die sich abhalten lassen). Evtl zusätzlich d) Wie viele haben beides angekreuzt.
      Viele Grüße & viel Erfolg!
      Wolf

  2. Hallo!

    Sitze gerade an meiner Doktorarbeit und bin etwas überfordert mit der Auswertung meiner Ergebnisse. Habe im Labor Experimente mit verschiedenen Medikamenten auf Zellen gemacht und möchte jetzt eine Kontrollgruppe A mit einer Experimentgruppe B und eine andere Kontrollgruppe C mit Experimentgruppen D, E und F vergleichen. Habe pro Gruppe ca. 20 Messungen und intervallskalierte Werte.
    Würde ich dann für den Vergleich zwischen A und B einen einfachen t-test machen? Und welchen Test kann ich für den Vergleich C-D,C-E und C-F am besten machen?

    Vielen Dank für die Hilfe!

    1. Hallo Julia,
      danke für den Kommentar! Ja, zwei Gruppenmittelwerte kann man per t-Test vergleichen. Bei mehr als zwei Gruppen Varianzanalyse. (Der t-Test ist ein vereinfachter Spezialfall der Varianzanalyse.)
      Viel Erfolg & viele Grüße!

  3. Hallo, ich bin gerade über Deinen Blog gestoßen und finde ihn sehr spannend. Ich habe eine Frage zur Varianzanalyse mit Messwiederholung. Ich habe fünf Gruppen, die ich zu zwei Zeitpunkten bezüglich verschiedener Perfektionismusdimensionen befragt habe. Nun zeigt die Varianzanalyse keinen signifikanten Unterschied, aber im post-hoc Test ist bei einer Gruppe ein signifikanter Unterschied des Messzeitpunkts zu sehen. Diesen würde ich gerne berichten. Nun steht aber überall, dass es nicht berichtet werden darf, wenn die vorausgegangene ANOVA nicht signifikant ist. Dann wiederum wird argumentiert, dass es sich bei den Verfahren um unterschiedliche Testverfahren handelt und man sich auch direkt die post-hoc Tests anschauen dürfte. Darf ich es nun berichten und wenn ja wo finde ich eine geeignete Literaturquelle, die das untermauert? Über eine Antwort würde ich mich sehr freuen. Viele Grüße Daniela

    1. Hallo Daniela,
      ich kenne es auch so, dass man Post-Hoc-Tests nach signifikantem Gesamtergebnis macht. Wenn Du den signifikanten Gruppenunterschied aus Post-Hoc berichten willst, dann würde ich auf jeden Fall auch das Gesamtergebnis berichten. Generell: Alle Tests dokumentieren (darf auch kurz sein), nicht nur das rauspicken, was einem gefällt.
      Literatur: Jürgen Bortz, Statistik für Human- und Sozialwissenschaftler fand ich ganz gut.

  4. Hallo,
    ich hätte zwei Fragen:
    1) Ich habe eine Auswertung gemacht bei der ich gerne prüfen würde, ob sich die Tendenz nach einem Teamtimeout im Handball in den nachfolgenden 5min verändert. Dazu habe ich den 5min-Abschnitt nach dem Teamtimeout in jeweils 1min-Blöcke unterteilt (also 5 Variablen) und jede Variable hat 3 Möglichkeiten (positiv/neutral/negativ). Wie bekomme ich jetzt raus, ob sich die Tendenz mit Zunahme der Zeit verändert? (Die Stichprobengröße wird mit Zunahme der Zeit immer kleiner)

    2) Desweiteren wüsste ich gerne ob gewisse Taktiken (z.B. Auswechslungen) öfter zu einer positiven Tendenz führen.

    Vielen Dank schonmal und schöne Grüße
    Hendryk

    1. Hallo Hendryk,
      für den Timeout-Effekt könnte man den Friedman-Test nehmen. Es handelt sich um abhängige Stichproben, da eine bestimmte Messung einem bestimmten Spiel zugeordnet ist. Der Test erfordert vollständige Daten, d. h. Spiele mit Fehlwerten ab einem bestimmten Messzeitpunkt werden ausgeschlossen. Man könnte mehrfach testen, z. B. bis zur 3. / 4. / 5. Minute, jeweils mit weniger Fällen, und die Ergebnisse vergleichen und diskutieren.
      Der Friedman-Test ist nichtparametrisch, d. h. er trifft keine Verteilungsannahmen. Die Zielvariable ist ordinal (Rangfolge klar, aber nicht fein abgestuft metrisch). Daher würde ich keine Varianzanalyse mit Messwiederholungen nehmen. Bei kleinen Fallzahlen und geringen Häufigkeiten in einer der drei Ergebnis-Kategorien könnte man nur den Vergleich von zwei Kategorien nehmen (z. B. positiv vs. nicht-positiv (neutral und neg. zusammen)) und mit dem McNemar-Test arbeiten.

    2. Zu 2) Kommt auf die Codierung der Daten an. Vorschlag: Kreuztabelle Taktik vs. Tendenz, Chi-Quadrat-Test (berücksichtigt die Rangfolgen der Tendenz nicht) oder Mann-Whitney-U-Test (Tendenz ordinal, vergleicht zwei Taktiken) oder Kruskal-Wallis-Test für mehr als zwei Taktik-Gruppen.

  5. Hallo,

    ich suche nach einem geeigneten Test für folgende Hypothese:

    Wenn man seine Lüge im Voraus plant, ist die kognitive Belastung während des Lügens geringer als wenn man die Lüge nicht vorher plant.

    Dabei habe ich eine Fallzahl von ca. 50 Leuten, die Variable zur Planung der Lüge hat die Ausprägungen [JA / NEIN / WEISS NICHT] und die Variable zur Messung kognitiver Belastung hat die Ausprägungen von 1 (gar nicht anstrengend) bis 6 (ausgesprochen anstrengend).

    Fragen:
    A) Liege ich richtig in der Annahme, dass die Planungsvariable nominalskaliert ist?
    B) Liege ich richtig in der Annahme, dass die Variable, die kognitive Belastung misst, ordinalskaliert ist?
    C) Von welcher Verteilung kann ich ausgehen bzw. wie finde ich die Verteilung der Variablen heraus?
    D) Welchen Test muss ich zu Überprüfung dieser Hypothese verwenden?

    Ich wäre sehr dankbar für eine Rückmeldung.

    Liebe Grüße

    1. Hallo Clara,
      interessante Hypothese!
      A) „Schlimme“ Antwort: Kommt drauf an. Kann man so sehen. Alternative: Weiß nicht = Fehlwert. Bleiben zwei Möglichkeiten, die man als dummycodiert auffassen kann (z. B. 0=nein, 1=ja). Dummycodierte Variablen können in vielen Verfahren (z. B. Regression) wie metrisch skalierte Variablen verwendet werden.
      B) Ja. Oft werden solche Variablen aber auch als (quasi-)metrisch aufgefasst und so verwendet.
      C) Am besten ist eine Kombination aus grafisch-visueller Analyse und einem statistischen Test. Zum Beispiel Histogramm mit Normalverteilungskurve. Normalverteilt (Gauß’sche Glockenform) heißt: die meisten Fälle liegen im mittleren Bereich – je näher an den Rändern, desto weniger Fälle. Test: Zum Beispiel Shapiro-Wilk-Test auf Normalverteilung.
      Das gilt für die kognitive Belastung. Die Planungsvariable kann bei so wenigen Ausprägungen nicht normalverteilt sein. Günstig für die Analyse wäre, wenn ja und nein einigermaßen ähnlich häufig auftreten. Problematisch wäre, wenn eine Antwortalternative nur ganz selten (z. B. weniger als 5 mal) vorkommt.
      D) Da gibt es mehrere Möglichkeiten. Die einfachste wäre ein t-Test für unabhängige Stichproben. Gruppenvariable: Planung ja/nein, abhängige: kogn. Belastung.
      Mögliche Erweiterung: Zusätzliche Variablen aufnehmen, z. B. Geschlecht und/oder Alter etc. Regressionsmodell mit kogn. Belastung als abhängiger Variable.
      Falls es Dir wichtig ist, bei Planung „weiß nicht“ mit zu berücksichtigen: Varianzanalyse (Anova) als Erweiterung des t-Tests.

  6. Hallo,
    ich habe ein Problem bei einer multiplen Regression. Und zwar weist meine abhängige Variable sowohl negative als auch positive Prozentwerte auf. Kann ich diese einfach so verwenden oder muss ich die Werte per Quadrierung zunächst alle positiv gestalten? Leider kann ich hierzu nirgends gute Informationen finden.
    Beste Grüße, Tobias

    1. Hallo Tobias,
      das ist prinzipiell kein Problem, die Werte der abhängigen Variable dürfen auch negativ sein.
      Das befreit Dich natürlich nicht davon, Modellvoraussetzungen zu testen und die Ergebnisse sorgfältig zu interpretieren.
      Viel Erfolg!

      1. Erstmal vielen Dank für die schnelle Antwort. Die Modellvoraussetzungen sind natürlich BLUE, so dass ich hier keine Probleme habe bzw. passende Modelle wähle.
        Mein Betreuer ist nur der Ansicht, dass die Prozentwerte sich gegenseitig ausgleichen würden und so falsche Ergebnisse geliefert werden und die ein absolutes No-Go ist. Allerdings ist es meiner Ansicht nach eher genau andersrum, da die eindeutig signifikante Variable bei einer Quadrierung nicht mehr signifikant ist und diese signifikant sein muss.
        Danke. Haben Sie eventuell einen Tipp in welchem Buch oder Onlinedokument man hierzu nähreres erfahren könnte?

        1. Literatur dazu habe ich grade nicht parat.
          Nach Deiner Beschreibung erscheint es mir weniger ein Problem der negativen Werte an sich zu sein, sondern eher eine Frage der Konstruktion der abhängigen Variable. Wie kommen die Prozentwerte zustande, sind sie direkt gemessen oder aus mehreren Variablen abgeleitet? Wie sind sie verteilt? Bei einer Quadrierung verliert man das Vorzeichen, d. h. was zuvor -20% waren, ist dann nicht mehr unterscheidbar von einem Wert, der zuvor +20% betrug. Ist das sinnvoll? (Das ist eine ernstgemeinte Frage – die Antwort kenne ich nicht, ohne den Kontext zu kennen – je nach Fragestellung kann die Antwort ja oder nein lauten.) Quadrierung erhöht auch die Bedeutung der Ausreißer.
          Ich würde weniger nach irgendwelchen „Regeln“ vorgehen, sondern mich möglichst an inhaltlichen Überlegungen orientieren. Was will ich messen und testen, und welche Art der Operationalisierung kommt dem Ziel inhaltlich am nächsten?
          Wenn negative Werte vermieden werden sollen, kann man das auch durch andere Transformationen erreichen, z. B. durch Addition des (negativen) Minimums, sodass der Wertebereich bei 0 beginnt.

  7. Hallo!
    Ich möchte eine multiple Regression rechnen, aber die Linearität und Homoskedastizität sind nicht erfüllt. Wie kann ich weiterverfahren?

    Liebe Grüße
    Tina

    1. Hallo Tina,
      da gibt es viele Möglichkeiten … Zum Beispiel:
      – prüfen, ob mit weiteren Prädiktoren bessere Anpassungen erreicht werden oder ob Prädiktoren ausgeschlossen werden sollten (z. B. bei Multikollinearität)
      – nichtlineare Terme aufnehmen
      – einflussreiche Ausreißer finden und ggf. ausschließen
      – die Regressionsdiagnostik beschreiben und diskutieren – die meisten Zusammenhänge sind nicht genau linear; bei vielen Modellen sind Voraussetzungen verletzt

  8. Hallo Herr Riepl,

    ich möchte Tests mit SPSS durchführen. Meine Daten sind nicht normalverteilt. Kann ich damit nur nicht-parametrische Tests durchführen oder auch zum Beispiel Kreuztabellen (Person-Chi²-Test) und Rangkorrelationen?

    Viele Grüße

    1. Hallo Seb,

      Chi² und Rangkorrelationen setzen keine Normalverteilung voraus. Chi² ist für kategoriale Daten, d. h. hier werden keine Rangfolgen berücksichtigt (anders gesagt: Die Sortierung der Kategorien spielt keine Rolle). Rangkorrelationen zähle ich zu den nichtparametrischen Verfahren.

      Die Abgrenzung (parametrische Verfahren nur bei NV) wird nicht immer so streng gesehen. Normalverteilungstests werden bei größeren Fallzahlen eher signifikant (im Sinne von keine NV) – gerade dann können die Tests Abweichungen von der NV besser kompensieren. Daher kann man auch grafische Methoden (z. B. Histogramm mit NV-Kurve) in die Entscheidung einbeziehen. Jürgen Bortz (Statistik für Human- und Sozialwissenschaftler) argumentiert, der t-Test reagiere robust auf Verletzungen seiner Voraussetzungen. (Problematisch wird es vor allem dann, wenn die Varianzen in den Gruppen ungleich sind und die Fallzahlen ebenfalls.)

  9. Sehr geehrter Herr Riepl,

    ich führe derzeit mit SPSS die Auswertung einer Befragung durch. Die Befragung hat innerhalb eines Unternehmens stattgefunden. Ich befinde mich derzeit bei den Tests um Unterschiede herauszufinden, allerdings Frage ich mich ob ich da die Angaben nur innerhalb eines Unternehmens gemacht wurden nur abhängige, verbundene Stichproben habe oder wäre es auch möglich, dass es unabhängig ist?

    Wenn Sie mir vlt kurz erklären könnten, wann ich Tests für abhängige Stichproben und wann für unabhängige Stichproben durchführe wäre ich Ihnen sehr dankbar. Wie gesagt sind die Daten alle nur innerhalb eines Unternehmens erfasst worden.

    1. Hallo Maik,

      es kommt auf die konkrete Fragestellung an. Viele Variablen können verwendet werden, um Gruppen zu bilden und zu vergleichen.

      Beispiel: Nehmen wir an, Sie vergleichen den Krankenstand zwischen zwei Abteilungen. Wenn es keine Zuordnung eines bestimmten Mitarbeiters in einer Abteilung zu einem bestimmten Mitarbeiter in der anderen Abteilung gibt, handelt es sich um unabhängige Stichproben.

      Anderes Beispiel: Sie messen den Krankenstand in einer Abteilung vor und nach einer Gesundheitsmaßnahme. Dann gibt es zu jedem Mitarbeiter zwei Messungen. Die Messung von Herrn Maier vor der Maßnahme ist der Messung von Herrn Maier nach der Maßnahme zugeordnet. (Anders formuliert: Der Test soll berücksichtigen, dass es sich hier 2x um dieselbe Person handelt.) Es handelt sich um abhängige Stichproben.

      Abhängige Stichproben können es auch sein, wenn es sich um verschiedene Messobjekte (z. B. Personen) handelt, aber mit klarer Zuordnung, zum Beispiel Trainings- oder Ehepartner.

      1. Sehr geehrter Herr Riepl,

        vielen Dank für die schnelle Antwort. Das erschließt sich mir soweit. Also angenommen ich habe bisher keine Gruppen, bilde aber einfach welche durch Zuordnung nach Geschlecht oder Einkommen etc. dann sind das unabhängige Stichproben?

        Auf ihr Beispiel bezogen, wenn ich nun eine Abteilung habe, in der der aktuelle Krankenstand abgefragt wird und zusätzlich dann eben noch Zusammenhang mit Geschlecht, Einkommen, Arbeitszeiten von den gleichen Personen in der Abteilung damit testen will. Unabhängige Stichproben?

        1. Ich weiß, „es kommt darauf an“-Antworten sind schrecklich, aber ich habe noch eine:
          Es kommt auf das Skalenniveau der Variablen an. Krankenstand metrisch (in Tagen / Jahr) und Geschlecht: Ja, unabhängige Stichproben.
          Krankenstand metrisch und Einkommen metrisch oder Arbeitszeiten metrisch: Dann machen Sie keinen Gruppenvergleich, sondern können z. B. Korrelationen berechnen. Da gibt es keine Auswahl zwischen abhängigen und unabhängigen Stichproben. Natürlich können Sie aus dem Einkommen oder den Arbeitszeiten Gruppen bilden (z. B. hoch / niedrig) und dann wieder Gruppenvergleiche mit unabhängigen Stichproben durchführen.
          „Von den gleichen Personen“ klingt missverständlich: Wenn Sie Frauen und Männer einer Abteilung vergleichen, dann haben Sie zwei Teilgruppen mit unterschiedlichen Personen.

  10. Hallo Herr Riepl,

    ich schreibe gerade meine Abschlussarbeit und muss dazu sechs Fragen eines ausgefüllten Fragebogens plus drei zusätzliche Fragen zu demographischen Daten mit SPSS analysieren. Leider habe ich von Statistik nun so gar keine Ahnung und weiß deshalb nicht welche Tests ich alles durchführen muss und hatte gehofft Sie könnten mir weiterhelfen. Die Fragebogen sind fertig ausgefüllt und alle Daten liegen vor. Ich muss also nun nur mit SPSS die Daten analysieren.

    Die ersten beiden Fragen befassen sich mit psychischen Problemen zu denen die Teilnehmer Angaben machen mussten. Sie hatten dabei die Auswahl anzukreuzen (immer, oft, manchmal, selten, nie) und diesen Antwortmöglichkeiten wurden die Zahlen 1 bis 5 zugewiesen.

    Die nächste Frage beschäftigt sich mit Erreichbarkeit durch das Handy. Die Teilnehmer konnten ja, nein oder trifft nicht zu ankreuzen. Dabei bekamen ja und nein die Zahlen 1 und 2 zugewiesen und trifft nicht zu die 98. Die nächste Frage ist gleich aufgebaut. und die dritte Frage auch mit 5 Antwortmöglichkeiten für die die Zahlen 1 bis 5 vergeben wurden und die Zahl 98 für keine Angabe.

    Die sechste Frage lässt sich nur mit ja oder nein beantworten und auch hier wurden den Antwortmöglichkeiten wieder die Zahlen 1 und 2 zugewiesen.

    Als letztes sind noch die demographischen Angaben. Eine Frage zum Geschlecht (männlich, weiblich) mit den zugewiesenen Zahlen 1 und 2. Eine Frage ob man eine leitenden Funktion inne hat (ja, nein) mit den zugewiesenen Zahlen 1 und 2. Und eine Frage zum Alter (unter 30, 30-44 Jahre, 45-55 Jahre, über 55) mit den zugewiesenen Zahlen 1 bis 4.

    Können Sie mir helfen und sagen was ich nun mit diesen Daten anfangen muss, welche Tests ich durchführen kann/muss?

    Viele Grüße,

    CESRL

    1. Hallo CESRL,
      danke für Ihren Kommentar!
      Zunächst ist es sinnvoll, Hypothesen zu formulieren. Es gibt ja verschiedene Möglichkeiten für Zusammenhänge zwischen den Variablen und es wird nicht erforderlich sein, alle Möglichkeiten auszuschöpfen. Was interessiert Sie besonders und welche Ergebnisse erwarten Sie?
      Dann ist es gut, die Skalenniveaus zu betrachten. Die mit 1 bis 5 codierten Fragen würde ich als ordinal betrachten (immer, oft, manchmal, selten sind nicht so genau definiert und meines Erachtens nicht als streng metrisch zu sehen; die Abstände zwischen den Kategorien sind nicht unbedingt gleich groß). Wenn Sie Gruppenvergleiche damit anstellen, empfehle ich nichtparametrische Tests. Zum Beispiel: Geben Frauen häufiger psychische Probleme an als Männer? Mann-Whitney-U-Test mit psychischen Problemen als abhängiger Variable, Geschlecht als Gruppenvariable.
      Die Werte 98 würde ich als Fehlwerte definieren, d. h. diese Probanden werden von den jeweiligen Analysen ausgeschlossen und man vergleicht Ja- mit Nein-Antworten.
      Wie gesagt gibt es recht viele Möglichkeiten und ich werde nicht alles in einem Kommentar beschreiben können …
      Viele Grüße,
      Wolf Riepl

      1. Hallo Herr Riepl,

        ich habe nun Hypothesen formuliert um diese zu testen. 2 Hypothesen sind durch jeweils nominal skalierte Fragen aufgestellt worden und 5 Hypothesen durch jeweils nominal und ordinal skalierte Fragen gemischt. Ich habe bereits gelesen, dass man sich aber in dem gemischten Fall, jeweils am „schwächsten Glied“ orientieren muss, also dann quasi nur Tests für nominal skalierte Fragen zulässig sind. Ich habe dafür nun ungerichtete Hypothesen aufgestellt, also muss ja zweiseitig getestet werden. Welche Tests kann ich nun damit durchführen? Nur den Pearson Chi Quadrat Test durch Kreuztabellen?

        Gruppenvergleiche anstellen habe ich verstanden, vielen Dank dafür. Und die Werte 98 habe ich nun als Fehlwerte definiert. Vielen Dank auch dafür.

        Viele Grüße,

        CESRL

        1. Hallo CESRL,
          es kommt darauf an, wie der „gemischte Fall“ aussieht. Wenn Sie Gruppenvergleiche durchführen wie in meinem vorigen Kommentar beschrieben, dann ist die Gruppenvariable nominal skaliert und die Testvariable ordinal. In diesem Fall nehmen Sie Tests für Ordinaldaten, z. B. den Mann-Whitney-U-Test. Die Gruppenvariable muss nicht ordinal sein.
          Bei Korrelationen zwischen ordinalskalierter und intervallskalierter Variable gilt Ihr Beispiel: Im Zweifel das nichtparametrische Verfahren, z. B. Rangkorrelation nach Spearman.
          Wenn Sie Kreuztabellen erstellen, können Sie mit dem Chi-Quadrat-Test prüfen, ob die Verteilung der einen Variable sich in den Untergruppen der anderen signifikant unterscheidet. Wenn dabei eine ordinalskalierte Variable verwendet wird, berücksichtigt der Test die Rangfolge nicht, sondern sieht nur die Kategorien, unabhängig von der Sortierung.

          1. Hallo Herr Riepl,

            bei nominal und nominal skalierter Frage dann den Pearson Chi Quadrat Test?

            Der gemischte Fall ist nicht ordinal- und intervallskaliert sondern nominal- und ordinalskaliert. Ich habe auch keine Gruppen, sondern einfach nur Daten/Angaben von einzelnen Personen eines Unternehmens bezüglich den Fragestellungen. Die Personen lassen sich nicht in eine oder die andere Gruppe einteilen. Also dann doch nicht den Mann-Whitney-U-Test oder?

            Kann ich sonst nichts mehr testen bei nominal- und ordinalskalierter, gemischter Hypothese?

            Eine Hypothese lautet dann zum Beispiel so: Es besteht ein signifikanter Zusammenhang zwischen der Erwartung durch Kollegen permanent erreichbar zu sein (nominal durch ja oder nein) und dem zu kurz kommen des Privatlebens durch die Arbeit (ordinal durch immer, oft selten, manchmal, nie, aber mit den Zahlen 1-5 versehen)

            Sorry für die Fragen, aber ich versteh leider noch nicht so viel darüber.

            Viele Grüße,

            CESRL

          2. > bei nominal und nominal skalierter Frage dann den Pearson Chi Quadrat Test?
            Ja. Wenn es zu viele Kategorien / zu kleine Fallzahlen werden, ggf. Gruppen zusammenfassen.

            > Der gemischte Fall ist nicht ordinal- und intervallskaliert sondern nominal- und ordinalskaliert. Ich habe auch keine Gruppen, sondern einfach nur Daten/Angaben von einzelnen Personen eines Unternehmens bezüglich den Fragestellungen.
            Sie können die nominalskalierte Variable als Gruppenvariable verwenden.

            Ihr Beispiel:
            Gruppenvariable: Erwartung, permanent erreichbar zu sein ja/nein (-> zwei Gruppen)
            Testvariable: Zu-kurz-Kommen des Privatlebens

            Weiter möchte ich es in den Kommentaren nicht mehr treiben …

  11. Hallo Herr Riepl,

    Ich bin ein ziemlicher SPSS-Neuling und komme momentan nicht weiter..
    Hier ist mein mein Problem:
    Um herauszufinden welche statistischen Tests für meine erhobenen Daten in Frage kommen, muss ich ja erstmal gucken ob meine Variablen normalverteilt sind. Mein Gesamtkollektiv lässt sich in zwei Gruppen unterteilen (Operationsmethode A und B). Diese beiden Gruppen will ich später hinsichtlich unterschiedlicher Parameter vergleichen (Blutverlust, OP-Dauer, etc.). Nun verstehe ich nicht, ob für den Normalverteilungstest für jede Variable ALLE Patienten (also beider OP Methoden zusammen) oder immer beide Stichproben einzeln auf Normalverteilung überprüft werden müssen. Ist letzteres der Fall, stellt sich mir die nächste Frage: Was mache ich wenn z.B. OP-Methode A hinsichtlich des Blutverlustes normalverteilt, OP-Methode B dies jedoch nicht ist. Entscheide ich mich dann grundsätzlich für nichtparametrische Testverfahren (z.B. U-test)?

    und noch eine andere Frage: Zu meiner Auswertung kommen auch dichotome Variablen (wie z.B. Intensivaufenthalt Ja/Nein). bei solch dichotomen Variablen, kann ja keine „Normalverteilung“ vorliegen. Benutze ich hierfür dann den chi²-Test oder besser den exakten Fisher-Test (exakter Chi²)?

    Ich hoffe meine Fragen machen Sinn und sind verständlich formuliert. Vielen vielen Dank im Voraus!

    1. Hallo Gäußchen,

      zum Normalverteilungstest: Exakter ist es, die Gruppen separat auf Normalverteilung zu prüfen. In der Praxis wird das allerdings oft nicht gemacht, sondern nur die Gesamtstichprobe getestet. Gibt es Abweichungen von der Normalverteilungsannahme, evtl. auch nur in einer Untergruppe, ist es streng genommen besser, einen nichtparametrischen Test durchzuführen. Hier gibt es allerdings erhebliche Spielräume. Z. B. schreibt Jürgen Bortz in Statistik für Human- und Sozialwissenschaftler, der t-Test reagiere robust auf Verletzungen seiner Voraussetzungen. Ich führe oft beide Tests durch (parametrisch und nichtparametrisch) und dokumentiere die Ergebnisse (den zweiten Test oft in einer Fußnote), dann ist man auf der sicheren Seite. Wenn sie zu unterschiedlichen Ergebnissen kommen, kann man das diskutieren.

      Ein Haken an Normalverteilungstests ist, dass sie eher bei großen Stichproben signifikant werden (im Sinne von signifikanter Abweichung von der Normalverteilung) und gerade bei großen Stichproben die Verfahren auch mit solchen Abweichungen robuster funktionieren. Bei kleinen Stichproben werden sie nicht so leicht signifikant, obwohl gerade da Abweichungen von der Normalverteilung kritischer sind. Empfehlung: Normalverteilung auch optisch prüfen (z. B. Histogramm mit Normalverteilungskurve).

      Der Fisher-Test ist dem Chi-Quadrat-Test vor allem bei sehr kleinen Stichproben überlegen. Für den Chi-Quadrat-Test sollten die erwarteten Häufigkeiten nicht (zu oft) unter 5 liegen.

      Hoffe das hilft weiter. Viel Erfolg!

  12. Hallo Herr Riepl,

    auf der Suche nach statistischen Methoden, die ich für meine Abschlussarbeit verwenden kann, bin ich auf Ihrer Seite gelandet. Ich hoffe Sie können mir ein wenig weiterhelfen bei der Auswahl der Methode(n).
    In meiner Arbeit untersuche ich die Arbeitgeberattraktivität der Gesundheitsbranche und habe dazu über einen Online-Fragebogen die Daten erhoben. Die meisten Daten sind nominalskaliert und univariat, diese würde ich mit einfacher deskriptiver Statistik darstellen. Jedoch habe ich insgesamt 5 Fragebogenitems mit einer fünf-stufigen Likert-Skala, hier würde ich die Mittelwerte berechnen und über einen T-Test überprüfen, ob die Mittelwerte signifikant verschieden sind. Die Skalen sollen jedoch mit den Daten des Geschlechtes kombiniert werden, ist dies so möglich?
    Eine weitere Frage ist mit welcher Methode ich von meiner Stichprobe auf die Grundgesamtheit schließen kann?

    Wie sie wahrscheinlich gemerkt haben bin ich statistisch ziemlich ahnungslos, deshalb verzeihen Sie mir bitte mögliche Fehler.

    Vielen Dank schon einmal im Voraus,
    Marcel S.

    1. Hallo Marcel,

      bei mehr als zwei Einzelvergleichen würde ich Varianzanalyse gegenüber t-Test bevorzugen. Bei mehreren Tests steigt die Wahrscheinlichkeit, dass mal „zufällig“ ein signifikantes Ergebnis dabei ist. Deshalb sollte der gesamte Hypothesenkomplex auf dem gewünschten Alpha-Niveau abgesichert werden. Salopp gesagt: Ein t-Test weiß nichts von den anderen t-Tests; in der Varianzanalyse kann man mehrere Einzelvergleiche zusammenfassen.
      Geschlecht mit berücksichtigen: Kommt drauf an, wie die Hypothesen lauten. Man kann für jeweils ein Item (oder eine Skala) die Geschlechter vergleichen: t-Test für unabhängige Stichproben. Oder Geschlecht als Kontrollvariable in einem komplexeren Modell, z. B. Varianz- oder Regressionsanalyse.

      Schluss von der Stichprobe auf die Grundgesamtheit: Das ist im Grunde die Idee hinter allen Signifikanztests, also keine Frage einer ganz bestimmten Methode. Neben der Statistik gehören Überlegungen dazu, wie die Grundgesamtheit definiert ist und ob die Stichprobe diese abbildet. Sind relevante Merkmale in der Stichprobe ähnlich verteilt wie in der Grundgesamtheit? Handelt es sich um eine Zufallssstichprobe? Etc.

      Eine detaillierte Betreuung kann ich in nächster Zeit leider nicht leisten, bin mit Projekten ausgelastet.

      Viele Grüße!

      Wolf

  13. Hallo,

    ich bin momentan auf der Suche nach dem geeigneten statistischen Testverfahren, um verschiedene Bedingungen innerhalb einer Stichprobe miteinander zu vergleichen.
    Es geht um eine recht kleine Stichprobe von ca. 20 Teilnehmern, die verschiedene Objektbewegungen auf einem Computerbildschirm identifizieren sollen.
    Vergleichen möchte ich dann Unterschiede in Genauigkeit der Antworten was zum Beispiel große und kleine Distanzen oder rechts und links angeht.
    Es handelt sich immer um eine Entscheidung zwischen: Ja, es hat eine Bewegung stattgefunden und Nein, es gab keine Bewegung.

    Da ich bisher wenig Erfahrung mit statistischer Auswertung habe, würde ich mich über einige Denkanstöße bezüglich der Auswahl eines geeigneten Verfahrens sehr freuen.

    Vielen Dank!

    1. Hallo Josefine,
      die kleine Stichprobe spricht meines Erachtens für nichtparametrische Verfahren. Bei Messwiederholung und dichotomem Merkmal (wie ja/nein) passt evtl. der McNemar-Test?

      1. Guten Morgen,

        vielen Dank für die schnelle Antwort! Nachdem ich alles noch einmal überdacht habe, ist mir aufgefallen, dass die Antwortmölichkeiten zwar ja/nein sind, die Anzahl der richtigen/falschen Antworten jedoch eine ganzzahlige Zahl sein wird, die normalverteilt ist. Aus diesem Grund tendiere ich zum momentanen Zeitpunkt zum t-test für eine einzige Stichprobe ohne Messwiederholungen. Auf diesem Wege müsste ich die beiden Bedingungen, die ich jeweils gegenüberstellen möchte mit einem Erwartungswert vergleichen können. Ist das richtig, oder denken Sie, dieser Test ist ungeeignet?
        Beste Grüße,
        Josefine

        1. Guten Morgen Josefine,
          hört sich gut an, Anmerkungen:
          Werden zwei Bedingungen verglichen, für die Sie eigene Daten haben? Jeder Teilnehmer hat jede Bedingung absolviert? t-Test für abhängige Stichproben (Messwiederholung)
          Vergleich zweier Bedingungen, wobei einige Teilnehmer Bedingung A absolviert haben, einige Bedingung B: t-Test für unabhängige Stichproben
          Vergleich einer Messung (Variable, Spalte) aus ihren Daten mit einem Erwartungswert, der nicht aus ihrem Datensatz stammt: t-Test für eine Stichprobe

          Bitte beachten: Wenn Sie sehr viele t-Tests durchführen, dann steigt die Wahrscheinlichkeit, zufällig ein signifikantes Ergebnis zu erzielen – Fachbegriff Alpha-Fehler-Kumulierung. Auf der verlinkten Webseite gibt es eine Anleitung, wie man manuell das Signifikanzniveau anpassen kann: p-Wert durch Anzahl der Einzelvergleiche teilen. Um der Alpha-Fehler-Kumulierung entgegenzuwirken, gibt es bei Varianzanalysen die Post-Hoc-Tests.

  14. Hallo Herr Riepl,

    ich hoffe Sie können mir bei meiner Methodenauswahl ein wenig behilflich sein, meine Dozentin ist momentan nicht erreichbar und Ich bin nicht so fit auf diesem Gebiet, da wir es in der Hochschule nie wirklich gelernt haben.

    Ich habe schon ein wenig Vorarbeit geleistet und meine Daten per Häufigkeitsverteilung, Mittelwert, etc. genauer betrachtet. Ich habe auch schon eine Faktorenanalyse durchgeführt um zu sehen welche Variablen für die FA geeignet sind.
    Jetzt geht es darum wie ich meine Hypothesen, mit welchen Methoden auswerten kann.
    Leider ist es so dass meine Dozentin von der Hochschule zwei Tests unbedingt haben möchte.
    2 multivariate Hypothesen anhand 2 multivariate Tests prüfen – Clusteranalyse, Regressionsanalyse mit Mediator oder Moderator oder Varianzanalyse mit oder ohne Messwiederholung.

    Welche Tests kann ich für welche Hypothese verwenden und sind meine Hypothesen überhaupt geeignet für für diese multivariaten Tests?

    Zuerst zu meinen Hypothesen:

    H1: Auf den einzelnen Social Media Plattformen sind mehr weibliche, als männliche Nutzer angemeldet.
    H2: Frauen sind prinzipiell zufriedener als Männer, in Bezug auf Social Media Plattformen.
    H3: Singles sind pro Tag länger auf Social Media Plattformen unterwegs, als Personen die in einer Beziehung bzw. verheiratet sind.
    H4: Männer wünschen sich weniger Werbeanzeigen auf Social Media Plattformen, als Frauen.
    H5: Jüngere Social Media Nutzer finden Werbeanzeigen interessanter, als Nutzer die älter als 30 Jahre sind.

    Stichprobengröße: n=212
    Thema: Social Media, Werbeanzeigen

    Können Sie mir bei meinem Problem helfen?
    Vielen Dank.

    Viele Grüße
    Sabrina

    1. Hallo Sabrina,
      danke für Ihre Nachricht!
      Ihre Hypothesen kann man bivariat testen, d. h. sie setzen jeweils zwei Variablen in Beziehung. Für multivariate Tests brauchen Sie mindestens drei Variablen.
      Clusteranalysen würde ich ausschließen, wenn Sie nahe an den bisherigen Hypothesen bleiben wollen – das ist ein exploratives Verfahren, bei dem man Gruppen bildet, d. h. es gibt keine Unterscheidung in abhängige und unabhängige Variablen. Regressionsanalysen oder Varianzanalysen sind besser geeignet, um ihre Hypothesen auf multivariate Anwendung zu erweitern.
      Für Messwiederholungen bräuchten Sie passende Daten. Die Hypothesen klingen eher nach Daten, die nur zu einem bestimmten Messzeitpunkt erhoben wurden. (Man kann allerdings auch den Vergleich verschiedener Social Media-Plattformen als Messwiederholungen modellieren.)

      Beispiel für eine multivariate Hypothese:
      Unter Kontrolle des Alters sind Frauen zufriedener als Männer in Bezug auf Social Media-Plattformen.
      Diese Hypothese können Sie mit Regressions- und Varianzanalysen testen.

      Moderator: Wechselwirkung, d. h. der Effekt einer Variable auf eine andere ist unterschiedlich je nach Ausprägung des Moderators.
      Mediator: Eine Drittvariable „vermittelt“ den Zusammenhang zwischen zwei anderen Variablen.

      1. Vielen Dank Wolf, dass du mir so schnell geholfen hast. Es ist manchmal echt schwierig herauszufinden welcher Test für welche Variablen geeignet ist. Das ist glaube ich für die meisten das schwierigste.
        Viele Grüße
        Sabrina

  15. Hallo,

    ich hoffe sehr auf Ihre Hilfe mit Methodenauswahl für meine Analyse.

    Ich habe folgende Daten:
    1. Ein Wert (eine abhängige Variable) für ca. 200 Unternehmen für Jahre 2004-2015. Für jedes Jahr gibt’s Daten für ca. 200 Unternehmen.

    2. Mehrere unabhängige Variablen (über 20), die die obengenannte abhängige Variable beeinflussen. Daten gibt’s auch für den Zeitraum 2004-2015 und für ca.200 Unternehmen.

    3. Einige unabhängige Variablen, die später als 2004 eingeführt wurden und die es nicht für alle Unternehmen gibt.. Manche wurden 2008 eingeführt (dann ist der Zeitraum für diese Variablen 2008-2015), andere 2012 (2012-2015) usw.

    Nun habe ich ein paar Fragen:
    1. Wie kann man analysieren, wie groß der Einfluss von jeder der unabhängigen Variable (s.o. Punkt 2) auf die abhängige Variable für die gesamte Zahl der Unternehmen ist?

    2. Kann man Analysieren, ob die Aufnahme neuer Variablen in den Datensatz (s.o.Punkt 3) einen Einfluss auf die abhängige Variable hat? Und wenn ja, wie groß dieser Einfluss wäre?

    Ich hoffe sehr auf Ihre Antwort! Würde mich auf jede Rückmeldung freuen!

    Vielen Dank!
    MfG
    Karelia P.

    1. Guten Abend Karelia,

      ja, das geht, aber es ist sehr fortgeschritten. Stichworte: Panelanalyse, GEE-Modelle (GEE = Generalized Estimating Equations).

      Viele Grüße,

      Wolf

  16. Hallo,
    Kenne mich leider statistisch nicht so gut aus und habe folgendes Problem.

    Habe diverse Daten von Banken, die ich in drei nicht überschneidende Banken-Gruppe gegliedert habe. Die Kennzahlen sind entweder von 0-100% oder theoretisch von minus unendlich bis plus unendlich. Eine Gruppe besteht nur aus 5 Teilnehmern.

    Ich möchte jetzt einen Mittelwertvergleich durchführen um signifikante Unterschiedeuu finden. Habe eine einfaktorielle ANOVA ausprobiert mit einem posthoc Test. Bin mir aber nicht sicher ob das richtig ist.

    Was musste man anwenden wenn Normalverteilungoder varianzhomogenität nicht gegeben sind bzw kann man die ANOVA überhaupt für alle oben genannten Tests anwenden?

    Danke jetzt schon für jede Antwort!
    LG Armin

    1. Hallo Armin,
      bei diesen kleinen Fallzahlen würde ich keine Anova nehmen oder wenn es unbedingt sein soll, dann wenigstens zusätzlich nichtparametrisch absichern. Die nichtparametrische Alternative ist der Kruskal-Wallis-Test. Er arbeitet nicht mit den Originalwerten, sondern mit Rangplätzen. Streng genommen macht man damit keinen Mittelwertvergleich, sondern einen Vergleich der „zentralen Tendenz“.
      Neuere SPSS-Versionen bieten auch dafür Post-Hoc-Tests an.
      Viel Erfolg!

      1. Vielen Dank für die Antwort Wolf!

        Ich habe gelesen das Kruskal Wallis Tests Probleme bei ungleichen Varianzen habe und es wurde ein Welch Test empfohlen. Kannst du dem zustimmen und würde das bei meinen Daten sinnvoll sein?

        1. Kruskal Wallis ist meines Wissens eine Alternative, wenn die Anova aufgrund ungleicher Varianzen problematisch ist. Da Kruskal Wallis nichtparametrisch (mit Rangplätzen) arbeitet, geht es nicht um Varianzgleichheit.

          Welch ist meines Wissens eine Korrektur bei t-Tests für ungleiche Varianzen.

          Anders gesagt: Kruskal Wallis müsste noch unempfindlicher gegenüber ungleichen Varianzen sein als t-Tests mit Welch-Korrektur.

  17. Hallo,

    ich versuche aktuell herauszufinden, wie sich die Arbeitsfähigkeit von Mitarbeitern einer Firma innerhalb von fünf Jahren verändert hat und suche dazu den richtigen Test.

    Gemessen wird die Arbeitsfähigkeit mit einem Fragebogen und es liegen insgesamt fünf Messzeitpunkte mit unterschiedlicher Teilnehmeranzahl vor. Nun möchte ich genau wissen, inwieweit sich die einzelnen Messungen unterscheiden und zudem die Ergebnisse anhand von 3 vorher festgelegten Altersgruppen analysieren, also welche Altergruppe sich wie verändert hat. Leider fehlt mir dazu das statistische Fachwissen, um sicher den richtigen Test auswählen zu können und hoffe deshalb hier auf Hilfe.

    Wenn meine Beschreibung verständlich ist, würde ich mich über eine Antwort sehr freuen. Vielen Dank vorab.

    1. Hallo Sven,
      klingt nach Varianzanalyse mit Messwiederholung. Mit welcher Software willst Du das analysieren? In SPSS z. B. unter Allgemeines Lineares Modell – Messwiederholung. Within Subjects: Veränderungen innerhalb der Mitarbeiter im Zeitverlauf; Between Subjects: Unterschiede zwischen Mitarbeitern (z. B. Altersgruppen).
      Die ganze Theorie dazu und die Optionen kann man nicht so kurz beschreiben …
      Viele Grüße!
      Wolf

      1. Hallo Wolf,

        vielen Dank für die rasche Antwort. Ja, ich werte die Daten mit SPSS aus. Nun bin ich dch mit Ihrer Antwort bereits ein Stück weiter gekommen. Da werde ich jetzt ansetzen und mich weiter schlau machen, um die einzelnen Schritte zu verstehen und anwenden zu können. Vielen Dank

        Sven

  18. Hallo ich bin gerade dabei drei Hypothesen zu überprüfen, leider sind meine Kenntnisse nicht sehr gut vor allem da ich nicht weiß welche Tests ich machen soll damit ich diese überprüfen kann.

    Ich hab folgende Hypothesen: Die Sympathie ist für Frauen bei einer Bankberatung wichtig, als wie für Männer
    Zweite: Angebot des Online-Bankings verwenden mehr Frauen als Männer und die Dritte: Männer sind eher unzufrieden mit ihrer Bankberatung als Frauen

    Alle drei Hypothesen hängen mit dem Geschlecht zusammen, ich habe es schon mit dem Mittelwert probiert aber damit kann ich meine Hypothesen nicht wirklich überprüfen. Bei der dritten Hypothese zum Beispiel möchte ich ja wissen wie viele Männer bei der Zufriedenheit des Bankberaters gesagt haben das es voll zutrifft, weniger zu trifft, zu trifft und nicht zu trifft.

    Kann mir jemand dabei helfen und mir sagen mit welchen Tests ich diese drei Hypothesen überprüfen kann?

    1. Hallo Claudia,

      ich fang mal in der Mitte an, weil die zweite Hypothese anders zu testen ist: So wie ich sie verstehe, ist das eine Kreuztabelle aus Online-Banking ja/nein und Geschlecht mit 2×2 = 4 Feldern. Da passt die unten stehende Antwort auf Lisa M.

      Bei der ersten und dritten Hypothese kommt es u. a. auf die Fallzahlen und Verteilungen an. Man könnte für Sympathie und Zufriedenheit schon Mittelwerte nehmen, wenn diese beiden Merkmale annähernd normalverteilt sind (grafische Überprüfung: z. B. Histogramm mit Normalverteilungskurve oder QQ-Plot; statistischer Test: z. B. Shapiro-Wilk). Dann t-Test für unabhängige Stichproben, Geschlecht jeweils als Gruppenvariable. Bei Nicht-Normalverteilung, kleiner Fallzahl und/oder sehr ungleichen Gruppengrößen (Anzahl Frauen vs. Männer) gibt es als Alternative den nichtparametrischen Mann-Whitney-U-Test.

      1. Vielen Lieben Dank für deine schnelle Hilfe.
        Die Kreuztabelle zeigt mir sehr gut wie viele Frauen und Männer was geantwortet haben.

  19. Hey,

    ich bin völlig in ahnungslos in Sachen Statistik und muss jetzt aber mit Spss meine Fragebogendaten auswerten.

    Ich habe folgende hypothese:

    Leistungsorientierte Badmintonspieler halten die Dienst- und Serviceleistungen des DBV für wichtiger als die freizeitorientierten Badmintonvereinsspieler.

    Dazu habe ich in meinen Daten einmal die Angabe zu der Spielorientierung meiner Stichprobe (1=Freizeitorientiert 2=Leistungsorientiert) und zu den jeweilien Dienst- und Serviceleistungen hab ich jeweils die Antwortmöglichkeit (1= sehr wichtig; 2=weniger wichtig)

    Es wäre super, wenn du mir sagen könntest welcher Test der richtige ist um meine Hypothese zu überprüfen. Vielen Dank!

    1. Hallo Lisa,

      mach eine einfache Kreuztabelle. Es gibt hier ja nur 2×2 = 4 Felder. Als Test würde ich den Chi-Quadrat-Test nehmen bzw. bei kleiner Fallzahl (Warnung unter der Tabelle, wenn Zellen eine erwartete Häufigkeit < 5 aufweisen) den exakten Test nach Fisher (beides steht in der Ergebnistabelle). Fisher hat noch den Vorteil, dass ein einseitiger Signifikanzwert angegeben wird. Du hast eine gerichtete Hypothese, da Du angibst, in welche Richtung Du einen Unterschied erwartest. Dadurch kannst Du einseitig testen und wirst mit einem kleineren p-Wert "belohnt". (Im Zweifelsfall Chi-Quadrat und Fisher berichten.) Falls der Unterschied in die andere Richtung weist (freizeitorientierte Badmintonspieler halten die Serviceleistungen häufiger für sehr wichtig), ist die Hypothese unabhängig vom p-Wert widerlegt. Die Nullhypothese lautet: Die relativen (=prozentualen) Häufigkeiten der Antwortmöglichkeiten "sehr wichtig" und "weniger wichtig" hinsichtlich der Serviceleistungen sind in beiden Gruppen der Badmintonspieler gleich. Ein signifikanter p-Wert (kleiner oder gleich 0,05) bedeutet, die Unterschiede sind signifikant. Viel Erfolg! Wolf

Freue mich über Kommentare!