Typologie Dresdner Stadtteile / Clusteranalyse mit „R“

Eine datenbasierte Typologie zu erstellen, ist leicht und schwierig zugleich. Leicht, weil eine Typologie nicht „falsch“ sein kann. Und deshalb gleichzeitig schwierig, weil der Forscher viele Entscheidungen zu treffen hat und weil es gilt, eine inhaltlich sinnvolle Interpretation zu finden. Heute geht es darum, Dresdner Stadtteile zu Typen zusammenzufassen. Dabei geht es um folgende Fragen: Wie … „Typologie Dresdner Stadtteile / Clusteranalyse mit „R““ weiterlesen

Statistiker, Mathematiker und Experten für Maschinelles Lernen denken unterschiedlich

Im Zeitalter von Big Data müssen die Fähigkeiten von Statistikern, Mathematikern und Experten für Maschinelles Lernen in immer stärkerem Maße verbunden werden, um „Datenschätze“ zu heben. Dabei kann es sehr hilfreich sein, sich der unterschiedlichen Denkweisen bewusst zu werden, die mit der jeweiligen Ausbildung einhergehen. Die folgende Geschichte veranschaulicht das eindrucksvoll. Arbeiten Statistiker, Data Scientists und … „Statistiker, Mathematiker und Experten für Maschinelles Lernen denken unterschiedlich“ weiterlesen

Buchbesprechung: The Art of R Programming von Norman Matloff

Wer sich an die freie Statistik-Software R heranwagt, findet mittlerweile eine Fülle an hilfreicher Literatur. Die Auswahl ist noch erheblich größer für diejenigen, die sich Fachbücher auf Englisch zutrauen. Für Norman Matloffs The Art of R Programming: A Tour of Statistical Software Design habe ich keine deutsche Version gefunden. Die Expertise des Autors kommt wohltuend zum Tragen. … „Buchbesprechung: The Art of R Programming von Norman Matloff“ weiterlesen

Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)

Wie hat sich die Dresdner Bevölkerung zwischen 1830 und 2013 entwickelt? Hab mal versucht, das grafisch darzustellen, sodass man auch einen Eindruck vom Frauen- und Männeranteil erhält und markante Einschnitte erkennbar sind: Markante Einschnitte in der Bevölkerungsentwicklung Dresdens 1830 bis 2013 Einige Anmerkungen zur Bevölkerungsentwicklung in Dresden: Kontinuierliches Bevölkerungswachstum bis zum ersten Weltkrieg Die Anzahl … „Bevölkerungsentwicklung in Dresden 1830-2013 nach Geschlecht (Visualisierungsbeispiel mit „R“)“ weiterlesen

Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)

Die Dresdner Stadtteile sind, wie kaum anders zu erwarten, unterschiedlich dicht besiedelt. Wo die Dresdner eng aufeinander wohnen und wo nicht, lässt sich am besten grafisch darstellen: Je dunkler die Fläche, desto höher die Besiedlungsdichte, d. h. desto mehr Einwohner je Hektar im jeweiligen Stadtteil. Die Liste zu den nummerierten Stadtteilen gibt es u. a. hier. … „Bevölkerungsdichte in Dresden: Visualisierungsbeispiel mit R (Choroplethenkarte)“ weiterlesen

SPSS 23: Einige neue Leistungsmerkmale

Kein Aprilscherz: Kürzlich ist SPSS 23 erschienen. Worin unterscheidet sich die neue Programmversion von ihren Vorgängern? Zeit und Raum Erweiterte zeit- und raumabhängige Vorhersagemodelle: STP – Spatio-Temporal Prediction Kausale Beziehungen in zeitlicher Abhängigkeit: TCM – temporal-kausale Modellierung Test, ob Entwicklungen direkt oder indirekt mit einem bestimmten Ort in Verbindung stehen: GSAR – Generalized Spatial Association Rule … „SPSS 23: Einige neue Leistungsmerkmale“ weiterlesen

Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit

Ein altes Thema: „Wie groß sind die Einkommensunterschiede zwischen Frauen und Männern, und worauf sind sie zurückzuführen?“ wurde kürzlich von Spiegel Online aufgegriffen. Einige Kernaussagen: Laut Statistischem Bundesamt beträgt die „Lohnlücke“, die hier als Differenz der Stundenlöhne definiert ist, zwischen Frauen und Männern in Deutschland 21,6%. Im europäischen Vergleich ist das Gefälle in Deutschland überdurchschnittlich … „Frauen verdienen weniger als Männer: Statistische Erklärungen, Gerechtigkeit“ weiterlesen

Signifikanztests bei Mehrfachantworten in SPSS

Kann man bei Mehrfachantworten Signifikanztests ausführen? Mehrfachantworten setzen sich typischerweise aus mehreren Variablen zusammen. Z. B. könnte in drei Variablen erfasst werden, welche Zeitungsarten jemand liest: Tageszeitung, Wochenzeitung, Fachzeitschrift. Nun wollen wir wissen, ob es bei den Lesegewohnheiten Geschlechtsunterschiede gibt bzw. anders formuliert, ob Lesegewohnheiten und Geschlecht von einander unabhängig sind. Chi-Quadrat-Test für Kreuztabellen Dazu … „Signifikanztests bei Mehrfachantworten in SPSS“ weiterlesen

Mist, der Test wird nicht signifikant: Kreativer Umgang mit p-Werten

Was macht man, wenn ein statistischer Signifikanztest nicht das tut, was er (vermeintlich!) soll: signifikant werden? xkcd kennt die Antwort: Vom kreativen Umgang mit p-Werten: Von „hochsignifikant“ bis zu „signifikant bei 10% Irrtumswahrscheinlichkeit“ und „Hey, schau Dir diese interessante Untergruppenanalyse an!“ Hier gibt es weitere Beiträge zum Thema Signifikanz.

t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)

Als Student fand ich die Vielzahl an statistischen Tests verwirrend. Das waren mir zu viele Schubladen – jeder Test macht irgendwie etwas anderes, wie soll man die auseinanderhalten und sich das alles merken? Dabei gibt es eine klare Verbindung zwischen den parametrischen Signifikanztests. Im Allgemeinen Linearen Modell (ALM) bzw. seiner Erweiterung Generalisiertes Lineares Modell (GLM, … „t-Test, Korrelation und Regression im Vergleich (Video-Tutorials)“ weiterlesen