R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden

Wie kann man R-Funktionen auf eine lange Variablenliste anwenden, ohne jeden einzelnen Variablennamen eintippen zu müssen? Das wird am Beispiel eines Datensatzes mit 235 NIR-Wellenlängen (NIR = near infrared spectroscopy) gezeigt. Dazu werden 235 einfache lineare Regressionsmodelle mit jeweils einer unabhängigen (und einer abhängigen) Variable aufgestellt, um dann die R²-Werte grafisch zu vergleichen. Es wird gezeigt, … „R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden“ weiterlesen

Statistisches rund um Glücksspiele

Glücksspiele haben die Menschen schon seit undenklichen Zeiten fasziniert. Den einen geht es um den „Kick“ (Aufregung), manchen auch um Geselligkeit, Entspannung oder Ablenkung. Geringe Bedeutung haben zudem die Motive „Sich auskennen“ und „Ungestört sein“. Das wichtigste Glücksspiel-Motiv der Deutschen ist laut BZgA / Forsa / Statista jedoch mit großem Abstand die Hoffnung auf Geldgewinn. Dieser … „Statistisches rund um Glücksspiele“ weiterlesen

Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

Buchbesprechung: The Art of #R Programming von Norman Matloff

Wer sich an die freie Statistik-Software R heranwagt, findet mittlerweile eine Fülle an hilfreicher Literatur. Die Auswahl ist noch erheblich größer für diejenigen, die sich Fachbücher auf Englisch zutrauen. Für Norman Matloffs The Art of R Programming: A Tour of Statistical Software Design habe ich keine deutsche Version gefunden. Die Expertise des Autors kommt wohltuend zum Tragen. … „Buchbesprechung: The Art of #R Programming von Norman Matloff“ weiterlesen

Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)

Wie hat sich die Dresdner Bevölkerung zwischen 1830 und 2013 entwickelt? Hab mal versucht, das grafisch darzustellen, sodass man auch einen Eindruck vom Frauen- und Männeranteil erhält und markante Einschnitte erkennbar sind: Markante Einschnitte in der Bevölkerungsentwicklung Dresdens 1830 bis 2013 Einige Anmerkungen zur Bevölkerungsentwicklung in Dresden: Kontinuierliches Bevölkerungswachstum bis zum ersten Weltkrieg Die Anzahl … „Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)“ weiterlesen

Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)

Die Dresdner Stadtteile sind, wie kaum anders zu erwarten, unterschiedlich dicht besiedelt. Wo die Dresdner eng aufeinander wohnen und wo nicht, lässt sich am besten grafisch darstellen: Je dunkler die Fläche, desto höher die Besiedlungsdichte, d. h. desto mehr Einwohner je Hektar im jeweiligen Stadtteil. Die Liste zu den nummerierten Stadtteilen gibt es u. a. hier. … „Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)“ weiterlesen

SPSS 23: Einige neue Leistungsmerkmale

Kein Aprilscherz: Kürzlich ist SPSS 23 erschienen. Worin unterscheidet sich die neue Programmversion von ihren Vorgängern? Zeit und Raum Erweiterte zeit- und raumabhängige Vorhersagemodelle: STP – Spatio-Temporal Prediction Kausale Beziehungen in zeitlicher Abhängigkeit: TCM – temporal-kausale Modellierung Test, ob Entwicklungen direkt oder indirekt mit einem bestimmten Ort in Verbindung stehen: GSAR – Generalized Spatial Association Rule … „SPSS 23: Einige neue Leistungsmerkmale“ weiterlesen

SPSS: Eine kleine Versionsgeschichte

Welche Unterschiede bestehen zwischen verschiedenen SPSS-Versionen? Für wen lohnt sich ein Upgrade? Bei welcher Version wurde welche neue Funktion / Verbesserung eingeführt? Bin mir nicht sicher, mit welcher Version ich zuerst gearbeitet habe. Vielleicht SPSS 7, oder 9 … Auf jeden Fall vor der 11.5. Variablennamen durften nicht länger als 8 Zeichen sein … Der … „SPSS: Eine kleine Versionsgeschichte“ weiterlesen