Wie hat sich die Dresdner Bevölkerung zwischen 1830 und 2013 entwickelt? Hab mal versucht, das grafisch darzustellen, sodass man auch einen Eindruck vom Frauen- und Männeranteil erhält und markante Einschnitte erkennbar sind:
Markante Einschnitte in der Bevölkerungsentwicklung Dresdens 1830 bis 2013
Einige Anmerkungen zur Bevölkerungsentwicklung in Dresden:
- Kontinuierliches Bevölkerungswachstum bis zum ersten Weltkrieg
- Die Anzahl der weiblichen Einwohner (rot) wird in dieser Abbildung wie der Männeranteil ab der Null-Linie (x-Achse) aufgebaut, sodass die Anzahl der Frauen an der y-Achse ablesbar ist. Somit enthält die rote Fläche nicht die Anzahl der Frauen in Dresden, sondern den Frauenüberschuss. Mit anderen Worten: die rote Fläche zeigt, dass mehr Frauen als Männer in Dresden wohnten.
- Den höchsten Stand erreichte die Dresdner Bevölkerung im Jahre 1933 mit 649.252 Einwohnern.
- Deutlich sind die Einschnitte erkennbar, die die beiden Weltkriege mit sich brachten.
- Als dritten Einschnitt habe ich den Zeitraum 1988 bis 1998 markiert – also von kurz vor der Wende bis knapp 10 Jahre danach. In dieser Zeit ging zum einen die Gesamtbevölkerung um über 60.000 Personen zurück, zum anderen halbierte sich der Frauenüberschuss von knapp 35.000 auf unter 17.000. 2013 waren nur noch knapp 7.000 Frauen mehr als Männer in Dresden wohnhaft.
- Die Anstiege sind nicht nur auf Geburtenüberschüsse und Zuwanderung zurückzuführen, sondern auch auf zahlreiche Eingemeindungen. Viele davon erfolgten vor dem ersten Weltkrieg. Nach dem zweiten Weltkrieg trugen die Eingemeindungen von 1945 sowie 1949/1950 zu dem steilen Anstieg bei. Das Jahr 1999 ist als Spitze erkennbar.
- Der kleine Einbruch 2011 hängt mit den Zensus-Ergebnissen zusammen.
Anmerkungen zur Erstellung der Grafik mit „R“
Die Erstellung einer aussagekräftigen Infografik kann viel Zeit in Anspruch nehmen. So war es auch hier.
Datenaufbereitung der Zeitreihen mir „R“
Die Daten lagen mir als PDF vor, das nicht gerade das benutzerfreundlichste Format zur Weiterverarbeitung darstellt. Die Aufbereitung erfolgte halb automatisiert, halb manuell. Zahlen lagen nicht für jedes Jahr zwischen 1830 und 2013 vor, sondern in unregelmäßigen Abständen. Zum Teil waren es sechs Jahre (zwischen 1840 und 1864), dann vier oder fünf Jahre, zum Teil gab es zweijährige Abstände, zum Teil jährliche Daten. Ich habe nur Jahre herangezogen, für die nicht nur die Gesamteinwohnerzahl vorlag, sondern auch die Anzahl der weiblichen und männlichen Einwohner.
Um eine durchgängige Darstellung zu erreichen anstatt lückenhafter Teilbereiche, und um alle verwendbaren Daten einfließen zu lassen, habe ich mich für einen Datensatz auf Jahresbasis entschieden, wobei die fehlenden Jahre „interpoliert“, also als berechnete Zwischenwerte ergänzt wurden. Dazu kam das R-Paket zoo zum Einsatz. Da eine lineare Interpolation (na.approx) eine stellenweise ziemlich eckige Darstellung zur Folge hat, habe ich mich für die kubische Interpolation (na.spline) entschieden, die bei fehlenden Werten für einen geglätteten, also weicheren Verlauf sorgt. Codeschnipsel:
library(zoo)
daten$weiblich <- na.spline(daten$weiblich)
Zeitreihen als Flächen: Gestapelt vs. nicht gestapelt
Das R-Paket plotrix bietet eine einfache Möglichkeit, mit dem Befehl stackpoly gestapelte Flächen darzustellen. Das sieht zum Beispiel so aus:
Hier wird die weibliche Bevölkerung über die männliche „gestapelt“, d. h. der obere Rand der roten Fläche stellt hier die Gesamtbevölkerung dar. Auch wenn diese Darstellungsweise zweifellos ihren Charme hat, hat sie mich nicht überzeugt. Sie verführt meines Erachtens zu Fehlinterpretationen. Der weibliche Teil der Bevölkerung (rote Fläche) beginnt nicht auf einer geraden Bezugslinie. Bei ähnlichem Verlauf der beiden Kurven wirken die Veränderungen bei den Frauen dramatischer, als sie sind – siehe vor allem die Einbrüche nach dem zweiten Weltkrieg und nach der Wende. Die Entwicklung der Geschlechtergruppen ist für mich schlechter vergleichbar als in der oberen Grafik. Die Anzahl der Frauen ist hier nicht direkt an der y-Achse ablesbar, sondern muss abzüglich der Männer errechnet bzw. geschätzt werden. Daher habe ich zwar stackpoly verwendet, allerdings mit der Option stack=FALSE.
Etwas gebastelt habe ich auch am Format der Einwohnerzahlen auf der y-Achse. Die sechsstelligen Zahlen fand ich ohne Trennzeichen nicht gut genug lesbar. Die von R angebotene wissenschaftliche Notation wollte ich den Lesern und mir nicht zumuten. Codeschnipsel:
yAchse <- seq(from=0, to=700000, by=100000)
yAchse2 <- prettyNum(yAchse, big.mark=“ „)
axis(4, at=yAchse, labels=yAchse2)
Die untere Darstellung enthält alternativ big.mark=“.“, was allerdings R zu einer Warnung veranlasst, weil der Punkt auch oft als Dezimaltrennzeichen verwendet wird (v. a. im englischsprachigen Bereich, somit auch generell häufig in der IT).
Die Ausgabe erfolgte im PDF-Format, mit dem Schriften gut eingebettet werden können. Inspiration stammte wiederum aus Datendesign mit R: 100 Visualisierungsbeispiele von Thomas Rahlf.
Lieber Leser, wie gefallen Dir die Beispiele? Bin für Anregungen dankbar!
Dieser Beitrag ist ein Update zur Choroplethenkarte von neulich zur Bevölkerungsdichte in Dresden.
Sehr informativ aufbereitet und anschaulich gestaltet. Ich schaue hier immer wieder gerne vorbei.
Mir gefallen die statistischen Erörterungen zu lokalen Phänomenen hier immer sehr, sehr gut. Auch die Ausführungen zum statistischen Arbeiten find ich ganz anschaulich.