Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)

Sind Sie gelangweilt von Standard-Excel-Diagrammen in Präsentationen, Berichten oder Abschlussarbeiten? Hier ein paar Beispiele, die mit der freien Statistik-Software R erstellt wurden, und zwar mit Hadley Wickhams ggplot2-Paket (sofern nicht anders angegeben). Beispiele für Boxplots mit Untergruppen Eine besondere Stärke von R besteht im sog. „faceting“: man kann Diagramme für Untergruppen elegant anordnen. Wer schon mal … „Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)“ weiterlesen

R-Programmierung: R-Funktionen auf Variablenliste anwenden (mit Video)

Wie kann man R-Funktionen auf eine lange Variablenliste anwenden, ohne jeden einzelnen Variablennamen eintippen zu müssen? Das wird am Beispiel eines Datensatzes mit 235 NIR-Wellenlängen (NIR = near infrared spectroscopy) gezeigt. Dazu werden 235 einfache lineare Regressionsmodelle mit jeweils einer unabhängigen (und einer abhängigen) Variable aufgestellt, um dann die R²-Werte grafisch zu vergleichen. Es wird gezeigt, … „R-Programmierung: R-Funktionen auf Variablenliste anwenden (mit Video)“ weiterlesen

Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit

Ein altes Thema: „Wie groß sind die Einkommensunterschiede zwischen Frauen und Männern, und worauf sind sie zurückzuführen?“ wurde kürzlich von Spiegel Online aufgegriffen. Einige Kernaussagen: Laut Statistischem Bundesamt beträgt die „Lohnlücke“, die hier als Differenz der Stundenlöhne definiert ist, zwischen Frauen und Männern in Deutschland 21,6%. Im europäischen Vergleich ist das Gefälle in Deutschland überdurchschnittlich … „Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit“ weiterlesen

t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)

Als Student fand ich die Vielzahl an statistischen Tests verwirrend. Das waren mir zu viele Schubladen – jeder Test macht irgendwie etwas anderes, wie soll man die auseinanderhalten und sich das alles merken? Dabei gibt es eine klare Verbindung zwischen den parametrischen Signifikanztests. Im Allgemeinen Linearen Modell (ALM) bzw. seiner Erweiterung Generalisiertes Lineares Modell (GLM, … „t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)“ weiterlesen

Marktforschung: Gehaltsstudie 2014

Wie entwickeln sich die Gehälter in der Marktforschungsbranche? Marktforschung.de veröffentlichte in Zusammenarbeit mit tivian die Gehaltsstudie 2014. Einige Zahlen:  Durchschnittliches Jahreseinkommen in der Marktforschung 2013/14: 54.290 € Dieser Wert liegt um rund 3.700 Euro signifikant über dem Durchschnittsgehalt 2011/2012; allerdings war das ein Rückgang gegenüber 2010/11; die Studienautoren werten die Veränderungen als „unsystematische Schwankungen“; der Korridor … „Marktforschung: Gehaltsstudie 2014“ weiterlesen

SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?

Der SPSS Modeler, die High-End-Statistik-Lösung von IBM SPSS, wartet mit einem vielversprechenden Knoten für die Datenvorbereitung auf: der Automatischen Datenvorbereitung (ADP, Automatic Data Preparation). Datenvorbereitung ist oft der zeitaufwändigste Arbeitsschritt Wer sich schon mal intensiver mit Datenauswertung oder data mining beschäftigt hat, hat sehr wahrscheinlich die Erfahrung gemacht, dass die Datenvorbereitung oft der zeitintensivste Arbeitsschritt … „SPSS Modeler – Automatische Datenvorbereitung: Was passiert da?“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen

Moderatoreffekte interpretieren und grafisch darstellen

Viele, die sich mit Statistik beschäftigen und dabei irgendwann auf sogenannte Moderatoreffekte stoßen, haben damit Schwierigkeiten. Wie man einen Moderatoreffekt „technisch“ prüft, kann man nachlesen (vgl. den Beitrag Interaktionseffekt): Man nimmt die unabhängige Variable (UV), den Moderator (der sich „technisch“ nicht von der Behandlung einer UV unterscheidet – die Bezeichnungen werden lediglich aus der Theorie … „Moderatoreffekte interpretieren und grafisch darstellen“ weiterlesen

Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?

Fragst Du Dich: Welcher statistische Test passt für meine Aufgabe, meine Daten, meine Fragestellung? Die Universität Zürich bietet eine empfehlenswerte Hilfestellung bei der Auswahl des geeigneten statistischen Tests bzw. der passenden multivariaten Analysemethode. In einem Entscheidungsbaum sind Unterschiedstests und Verfahren für Zusammenhangs- und Interdependenzanalysen dargestellt; farbliche Abstufungen berücksichtigen das Skalenniveau (nominalskaliert, ordinalskaliert oder intervallskaliert); zusätzlich … „Methodenberatung: Welcher statistische Test passt zu meiner Fragestellung und meinen Daten?“ weiterlesen