Ein einfaches Beispiel: wir betrachten eine übersichtliche Stichprobe mit drei Personen, die über folgende Monatseinkommen verfügen:
- Person A: 1.000 €
- Person B: 1.000 €
- Person D: 998.000 €
Das Durchschnittseinkommen beträgt:
(1.000 € + 1.000 € + 998.000 €) / 3 = 1 Million € / 3 = 333.333 €
Nehmen wir an, die drei leben „zusammen allein“ auf einer einsamen Insel. Wenn wir von einem durchschnittlichen Monatseinkommen von 333.333 € sprechen, so denken wir an großen Reichtum auf dieser Insel. Jedoch zwei der drei Personen sind relative „Habenichtse“.
Bei so schiefen Verteilungen wie in diesem Beispiel bietet sich ein alternatives Lagemaß an: der Median. Er ist der mittlere Wert der Verteilung. Klingt wie Mittelwert? Nein. Sortieren wir die Werte nach Größe (aufsteigend oder absteigend) und nehmen den „Wert in der Mitte“. Das sind in diesem Fall: genau 1.000 €. Er sagt uns, dass die Hälfte der Stichprobe nicht mehr verdient als 1.000 € (und nicht weniger). Mit diesen 1.000 € ist die Realität der Einkommensverteilung besser beschrieben als mit dem Mittelwert, der mit keinem realen Wert korrespondiert.
Hier als Video, mit etwas anderen Zahlen (9 Personen):
Oft ist es hilfreich, beide Kennwerte zu berechnen und zu vergleichen. Bei einer perfekten Normalverteilung sind sie identisch. Deutliche Abweichungen weisen auf schiefe Verteilungen bzw. Ausreißerwerte hin. Wie gesehen, ist der Median im Gegensatz zum Mittelwert „robust“ gegenüber Ausreißern.
Natürlich liefert auch der Median als einzelne Kenngröße keine vollständige Beschreibung der Verteilung. Ich plädiere für den „Mosaik“-Ansatz: aus mehreren Blickwinkeln auf Daten schauen, um Steinchen für Steinchen ein klareres Bild zu erhalten. Statistikprogramme wie SPSS oder Stata bieten eine große Auswahl an Kenngrößen für deskriptive Statistiken.
Hier eine, wenn auch nicht ganz aktuelle Statistik zu Löhnen und Einkommen:
Allerdings ist es nicht so einfach, Einkommen und vor allem Vermögen in Deutschland genau zu beziffern, wie dieser Beitrag aus Die Anstalt zeigt:
https://www.youtube.com/watch?v=ENGwzmtixa4
Dieser Beitrag ist ein Update zu Verteilungen vergleichen: Mittelwerte und Fallzahlen reichen manchmal nicht. Darin geht es um die Bedeutung der Standardabweichung.
Wie geht man eigentlich vor wenn man Median als Kriterium nimmt und es innerhalb der Gruppe gleiche Werte gibt. Z.B. bei einer Variablen Familienstand gibt es die Gruppen Nicht verheiratet – Verheiratet – Geschieden – Verwitwet. Bei einem Kruskal – Wallis test wenn der Median bei 2 oder mehr Gruppen gleich ist mit welchem weiterem Kriterium kann ich auf einer weiteren Ebene sehen ob es unterscheide gibt da ich diese einer Rangordnung zuweisen möchte (1er, 2er u.s.w.).
Danke!!!!!!
Hallo Tami,
beim Beispiel Familienstand gehe ich von einem kategorialen Merkmal aus – ich sehe hier keine fixe Rangfolge (Wertung? Mehrfache Heiraten / Scheidungen?). Da kann man für jede Kategorie die prozentualen Anteile vergleichen. Vermutlich werden die im Gruppenvergleich nicht durchgängig identisch sein. Signifikanztest z. B. Chi-Quadrat-Test.
Bei einem ordinalen Merkmal (z. B. Skala von 1 bis 4 mit klarer Rangfolge) bildet der Kruskal-Wallis-Test Rangsummen bzw. den mittleren Rang, den man zur Unterscheidung der Gruppen heranziehen kann. Am besten genau prüfen, dass man „hohe“ und „niedrige“ Rangplätze korrekt interpretiert.
Viel Erfolg!
Wolf
Vielen Dank für die schnelle Antwort.
Sorry für die unvollständige Darstellung meines Falles:
Also:
1. Die Variable Familienstand ist Nominal mit 1. Ledig, 2. Verheiratet, 3. Geschieden, 4. Verwitwet.
2. Es geht mir um die Analyse des Zusammenhangs der Variable Familienstand mit einer abhängigen Variable (Emotional Exhaustion) die Ratio ist (sprich 0,1,2, …., 54).
3. Ich habe die Normalverteilung mittels Shapiro-Wilk getestet (keine vorhanden) und via box plot gesehen dass es mehrere Ausreiser gibt und mich deshalb für Kruskal Wallis entschieden.
4. Emotional Exhaustion wird als niedrig, mittel oder hoch eingestuft (0-16= niedrig, 17-26 = mittel, > 27 = hoch).
5. Bei den Ergebnissen bei Kruskal Wallis erscheint eine Spalte „Mean Rank“, die mir zwar die Rangfolge der Emotional Exhaustion zeigt, aber mir keine Aussage über den Wert von Emotional Exhaustion gibt damit ich parallel auch Aussagen über die Zuordnung machen könnte.
Ranks
Familienstand N N Mean Rank
Emotional Exhaustion Ledig 35 106,39
Verheiratet 147 92,03
Geschieden 6 128,00
Verwitwet 2 62,75
Total 190
Aufgrund dessen habe ich mich entschieden, nach einiger Recherche, den Median zu benutzen. Jedoch habe ich bei 2 Gruppen den gleichen Median.
Welches weitere Kriterium A kann ich jetzt benutzen um einen Unterschied zwischen den beiden Gruppen zu finden, so dass ich sagen kann, dass die beiden Gruppen zwar den gleichen Median aufweisen aber aufgrund dessen das Gruppe X einen höheren Wert im Kriterium A aufweist, höher eingestuft wird als Gruppe Y.
z.B. 2 Fußballspieler schießen ein Tor, der eine schiebt den Ball nach einen Pass einfach ins Tor und der andere macht einen Fallrückzieher. Beide haben ein Tor geschossen doch der Fallrückzieher gibt einen Vorteil (obwohl hier das Kriterium fehlt, aber einfach nur so als Beispiel für das was ich suche).
Ich habe beobachtet dass die Reihenfolge (1er, 2er, u.s.w.) mit Kriterium den Mean Rank bei manchen Fällen eine andere ist als mit Median und gehe mal davon aus dass ich nicht den Mean Rank benutzen kann als Kriterium um zwischen den beiden Gruppen die den gleichen Median aufweisen zu unterscheiden. Richtig?
Vielen Dank nochmals!!
Hallo Tami,
der Median ist ein recht grobes Maß: Es wird „nur“ ein einzelner Wert aus der Verteilung herausgegriffen – der, der nach Sortierung „in der Mitte“ liegt. Der Mean Rank ist schon feiner abgestuft, weil hier alle Rangplätze einfließen.
Bei gleichem Median kann man ein anderes Maß heraussuchen, um eine Abstufung zu erreichen. Das könnte meines Erachtens auch der Mean Rank sein. Allerdings würde ich inhaltlichen Überlegungen den Vorrang vor einer rein statistischen Entscheidung einräumen. Ihr Beispiel mit dem Fallrückzieher zeigt das schön: Das ist ja kein statistisches Maß, sondern eine Wertung durch den Menschen. Vielleicht finden Sie für Ihr Beispiel auch eine gute Begründung, warum sie eine Gruppe höher einstufen.
Wenn man sich für den Median entscheidet, dann finde ich das Ergebnis „gleicher Median bei zwei Gruppen“ auch berechtigt – das ist ja auch eine interessante inhaltliche Aussage, die ich erstmal anerkennen würde.
Hoffe das hilft!
Vielen Dank für die Hilfe!
Wenn ich richtig verstanden habe ist Mean Rank genauer als Median. Sollte ich dann lieber für die Rangordnung anstatt Median den Mean Rank benutzen? Falls ich damit ein genauerer Ergebnis bekomme würde mir das reichen.
Der Mean Rank wird kaum in Ergebnisdarstellungen verwendet (vorrangig intern bei Tests wie K-W) und ist weniger intuitiv interpretierbar. Unter dem Median können sich die meisten Leser mehr vorstellen.
Ok… Danke nochmals. Wahr sehr hilfreich. Manchmal bleibt man an solchen „Kleinigkeiten“ hängen und verliert unnötig Zeit mit der Suchen einer Antwort im Internet.
PS. Habe ich das richtig verstanden das man bei 2 gleichen Median als weiteres Kriterium zwischen den Gruppen den Mean Rank benutzen kann, oder meinten sie dass man bei so einem Fall für alle Gruppen den Mean Rank benutzen sollte? Des weiteren habe ich gelesen das man wie man bei one way Anova Mean und Standard Deviation benutzt, so kann man bei Kruskal Wallis Median und Range nehmen. Kann man dabei Range als ein weiteres Kriterium bei gleichen Median benutzen? Wenn ja, welcher Rangwert würde einen Vorteil geben, der kleinere oder der größere?
Mean Rank ist möglich, aber meines Erachtens erklärungsbedürftig. Besser finde ich eine inhaltliche (statt einer rein statistischen) Begründung.
Range: Das ist für mich eher eine Zusatzinfo über die Verteilung, ich wüsste auch nicht, ob eine größere oder kleinere Range „besser“ ist.
Hallo Wolf.
Ich hätte eine Frage zu deiner gegebenen Antwort in diesem Fall. Ich habe ordinal skalierte Daten, mehrere Antwortmöglichkeiten die bewertet werden sollen von 1 sehr wichtig bis 4 sehr unwichtig und möchte diese nun darstellen. Nicht in Form von Häufigkeiten und auch nicht mit statistischen Tests. Ich bin am überlegen, ob der Median oder Mittelwert sinnvoller ist bei ordinal skalierten Daten. Oder benötige ich auch bei ordinal skalierten Daten immer erst ein Test auf Normalverteilung, um entscheiden zu können ob der Median oder Mittelwert angewendet werden soll?
Viele Grüße,
Stefan
Hallo Stefan,
bei so wenigen Kategorien (4) kann man auch inhaltlich entscheiden: Median.
Normalverteilung heißt ja im Grunde: Möglichst gute Annäherung an die Gaußsche Glockenform. Das ist bei nur vier verschiedenen x-Werten schwierig. Die NV-Tests (Shapiro-Wilk; manche empfehlen auch Kolmogorov-Smirnov) werden bei kleinen Fallzahlen nicht so leicht signifikant, d. h. man könnte dann auf Basis des Tests von Normalverteilung ausgehen, obwohl das inhaltlich und grafisch kaum haltbar ist.
Ich empfehle Median, wenn es nur ein Wert sein soll.
Wenn Du es ausführlicher machen willst, kannst Du trotzdem den Mittelwert zusätzlich angeben (und irgendwo die Skalenniveaus diskutieren), und Standardabweichung ergänzen. Fallzahlen ohnehin dokumentieren.
In den Sozialwissenschaften werden Ordinalskalen häufig mit parametrischen Verfahren ausgewertet … (Mittelwert, t-Test). Das ist besser haltbar, wenn man zeigt, dass man die Skalenniveaus und die Annahmen der verwendeten Tests kennt …
Hallo Wolf. Genau, bei mir kommt bei n=305 mit dem Kolmogorov-Smirnov test raus, das alle Daten nicht normalverteilt sind. Dementsprechend wollte ich argumentieren das deshalb der Median statt dem Mittelwert interpretiert wird. Jetzt habe ich gelesen das nur bei metrischen Skalenniveau dieser Prozess, mit test auf normalverteilung um entscheiden zu können ob Median oder Mitteltwert genommen wird , angewandt wird. Wenn ich dich richtig verstanden habe kann ich das aber auch genauso bei ordinalskalierung argumentieren wie gerade beschrieben?
Vielen Dank vor ab!
Das passt ja: Der K-S-Test legt nichtparametrische Verfahren nahe, ebenso wie die inhaltliche Überlegung (Ordinalskala).
Die Entscheidungen sind da leider nicht so eindeutig und die Grenzen nicht so klar, wie man es gerne hätte. Es wird z. B. auch argumentiert, dass bei größeren Fallzahlen (n = 305 zähle ich dazu – für parametrische Verfahren steht als Schwelle in der Literatur manchmal n = 30) Verfahren wie t-Tests nicht mehr so empfindlich auf Verletzungen ihrer Voraussetzungen reagieren. (Z. B. Bortz, Statistik für Human- und Sozialwissenschaftler)
Heißt: Ich würde die NV-Tests schon mit dokumentieren.
Hallo, ebenfalls Danke für die einfache Erklärung.
Wie wäre es zusätzlich mit einer Grafik der Einkommensverteilung? Daraus könnte man schön sehen dass die Verteilung des Einkommens recht weit von der Normalverteilung entfernt ist.
Das Beste was ich auf die Schnelle gefunden habe ist:
https://upload.wikimedia.org/wikipedia/commons/a/a8/ESt_Statistik_D_Steuerpflichtige_Grundtarif_2010.svg
Sieht mehr nach einer Weibullverteilung aus? Aber auch nicht so ganz.
Danke! Bin endlich dazu gekommen, den Beitrag zu ergänzen.
Vielen Dank! Kamen heute in einem Gespräch auf Median oder Mittelwert zu sprechen – keiner wusste so recht, wann die eine oder andere Größe sinnvoll ist. Das ist jetzt – dank dieser „auf den Punkt gebrachten“ Darstellung – geklärt!
Freut mich!