Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)

Finden Sie statische Diagramme langweilig? Die freie Statistik-Software R bietet verschiedene Möglichkeiten, Diagramme interaktiv zu gestalten. Die einfachere Variante besteht darin, HTML in Verbindung mit Javascript einzusetzen. Hier eine Heatmap, die die Leistung verschiedener Standorte im Hinblick auf diverse Prüfkriterien visualisiert. Die interaktive Version wurde auf eine separate Seite gelegt und ist per Klick erreichbar. … „Interaktive Diagramme in R: Heatmap mit Mouseover (HTML / Javascript)“ weiterlesen

Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?

Balken- und Säulendiagramme werden immer noch häufig verwendet, um Mittelwertsunterschiede darzustellen – obwohl zumindest in Fachkreisen schon viel Kritik an diesem Diagrammtyp geäußert wurde. Für einen schnellen optischen Eindruck mag es passen – oder auch nicht. Der Mittelwert allein ist nur ein Aspekt einer Verteilung. Hier ein Beispiel: require(ggplot2) ggplot(daten) + aes(x = Geschlecht, y … „Säulendiagramm vs. Punktdiagramm – irreführend vs. informativ?“ weiterlesen

R-Programmierung: R-Funktionen auf Variablenliste anwenden (mit Video)

Wie kann man R-Funktionen auf eine lange Variablenliste anwenden, ohne jeden einzelnen Variablennamen eintippen zu müssen? Das wird am Beispiel eines Datensatzes mit 235 NIR-Wellenlängen (NIR = near infrared spectroscopy) gezeigt. Dazu werden 235 einfache lineare Regressionsmodelle mit jeweils einer unabhängigen (und einer abhängigen) Variable aufgestellt, um dann die R²-Werte grafisch zu vergleichen. Es wird gezeigt, … „R-Programmierung: R-Funktionen auf Variablenliste anwenden (mit Video)“ weiterlesen

Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

Logging mit R: Befehle und Ergebnisse direkt in einer Datei protokollieren (Video)

Wie kann man Befehle und Ergebnisse einer R-Sitzung protokollieren? Hier eine Lösung, die ohne Erweiterungspakete (packages) auskommt: Ich verwende das sehr empfehlenswerte RStudio.

Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

Buchbesprechung: The Art of R Programming von Norman Matloff

Wer sich an die freie Statistik-Software R heranwagt, findet mittlerweile eine Fülle an hilfreicher Literatur. Die Auswahl ist noch erheblich größer für diejenigen, die sich Fachbücher auf Englisch zutrauen. Für Norman Matloffs The Art of R Programming: A Tour of Statistical Software Design habe ich keine deutsche Version gefunden. Die Expertise des Autors kommt wohltuend zum Tragen. … „Buchbesprechung: The Art of R Programming von Norman Matloff“ weiterlesen

Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)

Wie hat sich die Dresdner Bevölkerung zwischen 1830 und 2013 entwickelt? Hab mal versucht, das grafisch darzustellen, sodass man auch einen Eindruck vom Frauen- und Männeranteil erhält und markante Einschnitte erkennbar sind: Markante Einschnitte in der Bevölkerungsentwicklung Dresdens 1830 bis 2013 Einige Anmerkungen zur Bevölkerungsentwicklung in Dresden: Kontinuierliches Bevölkerungswachstum bis zum ersten Weltkrieg Die Anzahl … „Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)“ weiterlesen

Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)

Die Dresdner Stadtteile sind, wie kaum anders zu erwarten, unterschiedlich dicht besiedelt. Wo die Dresdner eng aufeinander wohnen und wo nicht, lässt sich am besten grafisch darstellen: Je dunkler die Fläche, desto höher die Besiedlungsdichte, d. h. desto mehr Einwohner je Hektar im jeweiligen Stadtteil. Die Liste zu den nummerierten Stadtteilen gibt es u. a. hier. … „Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)“ weiterlesen