R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden

Wie kann man R-Funktionen auf eine lange Variablenliste anwenden, ohne jeden einzelnen Variablennamen eintippen zu müssen? Das wird am Beispiel eines Datensatzes mit 235 NIR-Wellenlängen (NIR = near infrared spectroscopy) gezeigt. Dazu werden 235 einfache lineare Regressionsmodelle mit jeweils einer unabhängigen (und einer abhängigen) Variable aufgestellt, um dann die R²-Werte grafisch zu vergleichen. Es wird gezeigt, … „R Anwendungsbeispiel mit Video: R-Funktionen auf Variablenliste anwenden“ weiterlesen

Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

Logging mit R: Befehle und Ergebnisse direkt in einer Datei protokollieren (Video)

Wie kann man Befehle und Ergebnisse einer R-Sitzung protokollieren? Hier eine Lösung, die ohne Erweiterungspakete (packages) auskommt: Ich verwende das sehr empfehlenswerte RStudio.

Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

Buchbesprechung: The Art of #R Programming von Norman Matloff

Wer sich an die freie Statistik-Software R heranwagt, findet mittlerweile eine Fülle an hilfreicher Literatur. Die Auswahl ist noch erheblich größer für diejenigen, die sich Fachbücher auf Englisch zutrauen. Für Norman Matloffs The Art of R Programming: A Tour of Statistical Software Design habe ich keine deutsche Version gefunden. Die Expertise des Autors kommt wohltuend zum Tragen. … „Buchbesprechung: The Art of #R Programming von Norman Matloff“ weiterlesen

Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)

Wie hat sich die Dresdner Bevölkerung zwischen 1830 und 2013 entwickelt? Hab mal versucht, das grafisch darzustellen, sodass man auch einen Eindruck vom Frauen- und Männeranteil erhält und markante Einschnitte erkennbar sind: Markante Einschnitte in der Bevölkerungsentwicklung Dresdens 1830 bis 2013 Einige Anmerkungen zur Bevölkerungsentwicklung in Dresden: Kontinuierliches Bevölkerungswachstum bis zum ersten Weltkrieg Die Anzahl … „Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)“ weiterlesen

Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)

Die Dresdner Stadtteile sind, wie kaum anders zu erwarten, unterschiedlich dicht besiedelt. Wo die Dresdner eng aufeinander wohnen und wo nicht, lässt sich am besten grafisch darstellen: Je dunkler die Fläche, desto höher die Besiedlungsdichte, d. h. desto mehr Einwohner je Hektar im jeweiligen Stadtteil. Die Liste zu den nummerierten Stadtteilen gibt es u. a. hier. … „Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)“ weiterlesen