Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)

Sind Sie gelangweilt von Standard-Excel-Diagrammen in Präsentationen, Berichten oder Abschlussarbeiten? Hier ein paar Beispiele, die mit der freien Statistik-Software R erstellt wurden, und zwar mit Hadley Wickhams ggplot2-Paket (sofern nicht anders angegeben). Beispiele für Boxplots mit Untergruppen Eine besondere Stärke von R besteht im sog. „faceting“: man kann Diagramme für Untergruppen elegant anordnen. Wer schon mal … „Diagramme für Präsentationen, Berichte, Abschlussarbeiten: Beispiele mit der freien R-Software (Boxplots, Histogramme, Streudiagramme)“ weiterlesen

R Zertifizierung: Machine Learning Toolbox (DataCamp)

Nach einer Phase intensiverer Projektarbeit schaute ich nach längerer Zeit mal wieder bei DataCamp rein: Dort wurde inzwischen das Kursangebot erheblich erweitert. Einer der etwas neueren Kurse heißt Machine Learning Toolbox, rund um das caret-Paket, gelehrt vom Haupt-Entwickler Max Kuhn sowie dem Co-Autor Zachary (Zach) Mayer. Es geht um Supervised Learning, „überwachtes Lernen“: Modelle, die auf eine … „R Zertifizierung: Machine Learning Toolbox (DataCamp)“ weiterlesen

R Zertifizierung: R für SAS / SPSS / Stata Anwender (DataCamp)

Weitere R-Zertifizierung abgeschlossen: R für SAS / SPSS / Stata Anwender. Im Vergleich zu anderen Kursen bei DataCamp war dieser wesentlich umfangreicher, mit insgesamt 21 statt der üblichen drei bis fünf Kapiteln. Für Neueinsteiger bei DataCamp empfehle ich, diesen Kurs früh zu absolvieren, wenn man bereits Erfahrung mit wenigstens einem der Statistik-Pakete SAS, SPSS oder … „R Zertifizierung: R für SAS / SPSS / Stata Anwender (DataCamp)“ weiterlesen

R Zertifizierung: Machine Learning (DataCamp)

Nun ist auch der Machine Learning-Kurs von DataCamp abgeschlossen. Es ging um die drei Themenbereiche Klassifikation, Regression und Clustering. Von maschinellem Lernen wird nur gesprochen, wenn ein Algorithmus ein Modell ermittelt, das auf andere Daten (z. B. künftige Beobachtungen) angewendet werden kann. Deskriptive Statistiken (häufigste Farbe, durchschnittliche Größe) zählen somit nicht zum maschinellen Lernen. Einige Kursinhalte: … „R Zertifizierung: Machine Learning (DataCamp)“ weiterlesen

Zertifizierung Stanford University: Statistical Learning

Kurs abgeschlossen: Statistical Learning, Stanford University. Basiert auf: An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics)   Kursinhalte: Einführung, Überblick über Statistisches Lernen Lineare Regression Klassifikation Resampling-Methoden Modell-Optimierung, Modell-Auswahl Nichtlineare Modelle Entscheidungsbäume (tree-based methods) Support Vector Machines Unüberwachtes Lernen (Unsupervised Methods) Sie / Ihre Firma arbeiten mit R? Gern biete … „Zertifizierung Stanford University: Statistical Learning“ weiterlesen

R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden

Wie kann man R-Funktionen auf eine lange Variablenliste anwenden, ohne jeden einzelnen Variablennamen eintippen zu müssen? Das wird am Beispiel eines Datensatzes mit 235 NIR-Wellenlängen (NIR = near infrared spectroscopy) gezeigt. Dazu werden 235 einfache lineare Regressionsmodelle mit jeweils einer unabhängigen (und einer abhängigen) Variable aufgestellt, um dann die R²-Werte grafisch zu vergleichen. Es wird gezeigt, … „R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden“ weiterlesen

Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit

Ein altes Thema: „Wie groß sind die Einkommensunterschiede zwischen Frauen und Männern, und worauf sind sie zurückzuführen?“ wurde kürzlich von Spiegel Online aufgegriffen. Einige Kernaussagen: Laut Statistischem Bundesamt beträgt die „Lohnlücke“, die hier als Differenz der Stundenlöhne definiert ist, zwischen Frauen und Männern in Deutschland 21,6%. Im europäischen Vergleich ist das Gefälle in Deutschland überdurchschnittlich … „Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit“ weiterlesen

t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)

Als Student fand ich die Vielzahl an statistischen Tests verwirrend. Das waren mir zu viele Schubladen – jeder Test macht irgendwie etwas anderes, wie soll man die auseinanderhalten und sich das alles merken? Dabei gibt es eine klare Verbindung zwischen den parametrischen Signifikanztests. Im Allgemeinen Linearen Modell (ALM) bzw. seiner Erweiterung Generalisiertes Lineares Modell (GLM, … „t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)“ weiterlesen

Marktforschung: Gehaltsstudie 2014

Wie entwickeln sich die Gehälter in der Marktforschungsbranche? Marktforschung.de veröffentlichte in Zusammenarbeit mit tivian die Gehaltsstudie 2014. Einige Zahlen:  Durchschnittliches Jahreseinkommen in der Marktforschung 2013/14: 54.290 € Dieser Wert liegt um rund 3.700 Euro signifikant über dem Durchschnittsgehalt 2011/2012; allerdings war das ein Rückgang gegenüber 2010/11; die Studienautoren werten die Veränderungen als „unsystematische Schwankungen“; der Korridor … „Marktforschung: Gehaltsstudie 2014“ weiterlesen