Statistik-Blog

Storytelling mit Daten: Cole Nussbaumer Knaflic

Storytelling mit Daten zählt zu den bekanntesten Werken in seinem Bereich. Nachdem ich mehrmals auf Empfehlungen gestoßen war, unter anderem in Claus Wilkes Fundamentals of Data Visualization, las ich vor einiger Zeit Cole Nussbaumer Knaflics Werk endlich selbst (auf Englisch). Es hat sich definitiv gelohnt! Zur Person: Cole Nussbaumer Knaflic Bevor ich näher auf das … „Storytelling mit Daten: Cole Nussbaumer Knaflic“ weiterlesen

Von SAS zu R in der Pharmaindustrie: Paradigmenwechsel!

In den Biowissenschaften und der Pharmaindustrie spielen Datenverarbeitung und insbesondere statistische Datenanalysen eine fundamentale Rolle. Seit Jahrzehnten dominierte dabei die kommerzielle Software SAS (Statistical Analysis System). Nun sind starke Initiativen auf mehreren Ebenen hin zum Einsatz von R in der Pharmaindustrie zu beobachten – verbunden mit einem erstaunlichen Kulturwandel!

In den Biowissenschaften und der Pharmaindustrie spielen Datenverarbeitung und insbesondere statistische Datenanalysen eine fundamentale Rolle. Seit Jahrzehnten dominierte dabei die kommerzielle Software SAS (Statistical Analysis System). Nun sind starke Initiativen auf mehreren Ebenen hin zum Einsatz von R in der Pharmaindustrie zu beobachten – verbunden mit einem erstaunlichen Kulturwandel!

6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht

Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Lebensstilen und Ernährungsverhalten von Jugendlichen und … „6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht“ weiterlesen

Datenvisualisierung: Fundamentals of Data Visualization von Claus O. Wilke

2019 legte Claus O. Wilke mit Fundamentals of Data Visualization ein sehr lesenswertes Buch über Datenvisualisierung vor, das einige Vorzüge gegenüber vergleichbaren Werken bietet: Wer es gerne physisch in Papierform in der Hand hält, kann es selbstverständlich käuflich erwerben. Es steht jedoch auch kostenlos online im Volltext zur Verfügung. Damit folgt es dem Beispiel von … „Datenvisualisierung: Fundamentals of Data Visualization von Claus O. Wilke“ weiterlesen

R Markdown: Warum Ihr JETZT zu Quarto wechseln solltet

Zugegeben: Der Titel ist ein wenig provokativ. Wer über etablierte Projekte verfügt, in denen Markdown-Dokumente erstellt werden, muss nicht sofort alles über Bord werfen – der Code wird weiterhin funktionieren. Doch es gibt mehrere sehr gute Gründe, zu Quarto zu wechseln – besser jetzt als später. Doch zunächst etwas Hintergrund: Was haben Quarto und R … „R Markdown: Warum Ihr JETZT zu Quarto wechseln solltet“ weiterlesen

Warum Du parallel::detectCores() in R NICHT verwenden solltest

parallel::detectCores() zur Parallelisierung von R-Code ist populär, kann aber Probleme verursachen. Besser: parallelly::availableCores().

parallel::detectCores() zur Parallelisierung von R-Code ist populär, kann aber Probleme verursachen. Besser: parallelly::availableCores().

Aus RStudio wurde Posit!

RStudio, die vielleicht bekannteste Firma im R-Umfeld, hat sich in Posit umbenannt. Posit ist ein real existierendes Wort: es bedeutet, eine Idee zur Diskussion zu stellen. Das ist ein charakteristischer Bestandteil der Arbeit von Data Scientists (Hypothesen aufstellen und testen!) und reflektiert damit die Arbeit der datengetriebenen Open-Source-Gemeinschaft sowie den wissenschaftlichen Ehrgeiz, stets nach einem … „Aus RStudio wurde Posit!“ weiterlesen

R und Shiny: Was ist Reaktivität / Reaktives Programmieren?

Der Erfolg von Datenanalysen beruht nicht nur auf den Ergebnissen selbst, sondern zunehmend auch darauf, wie sie präsentiert und anderen zugänglich gemacht werden. R bietet mit Shiny ein großartiges Werkzeug, um interaktive Webapplikationen zu erstellen. Dazu sind weder HTML- noch CSS- oder Javascript-Kenntnisse erforderlich. Shiny: Umdenken von bisheriger R-Programmierung Wer bereits Erfahrungen mit der R-Programmierung … „R und Shiny: Was ist Reaktivität / Reaktives Programmieren?“ weiterlesen

Geht nicht, gibt´s nicht – Probability at Risk

0% – Dieser Wert steht in der Nachbetrachtung einer Versuchsreihe dafür, dass ein Ereignis nicht eingetreten ist. So weit, so gut. Prognostiziert man jedoch für ein zukünftiges Ereignis eine Auftretenswahrscheinlichkeit von 0%, würde man dieses Ereignis schlicht unmöglich klassifizieren. Das ist jedoch ein Trugschluss. Denn geht nicht, gibt’s nicht. Dies gilt auch in der Statistik. Die relative Häufigkeit von 0% ist daher als Schätzer der Wahrscheinlichkeit in diesem Fall ungeeignet. Anhand der Methodik der «Probability at Risk » kann eine Schätzung der Wahrscheinlichkeit vorgenommen werden, auch wenn das Ereignis bisher (noch) nicht eingetreten ist. Beispiele aus dem Sport & TV, sowie dem Gesundheitswesen sollen zum einen die Vielschichtigkeit dieser Problematik aufzeigen, wie gleichzeitig auch die Methodik anschaulich erläutern.

0% – Dieser Wert steht in der Nachbetrachtung einer Versuchsreihe dafür, dass ein Ereignis nicht eingetreten ist. So weit, so gut. Prognostiziert man jedoch für ein zukünftiges Ereignis eine Auftretenswahrscheinlichkeit von 0%, würde man dieses Ereignis schlicht unmöglich klassifizieren. Das ist jedoch ein Trugschluss. Denn geht nicht, gibt’s nicht. Dies gilt auch in der Statistik. Die relative Häufigkeit von 0% ist daher als Schätzer der Wahrscheinlichkeit in diesem Fall ungeeignet. Anhand der Methodik der «Probability at Risk » kann eine Schätzung der Wahrscheinlichkeit vorgenommen werden, auch wenn das Ereignis bisher (noch) nicht eingetreten ist. Beispiele aus dem Sport & TV, sowie dem Gesundheitswesen sollen zum einen die Vielschichtigkeit dieser Problematik aufzeigen, wie gleichzeitig auch die Methodik anschaulich erläutern.

Die Achterbahnfahrt des SC Freiburg im DFB-Pokal 2021/22

Der Pokal hat seine eigenen Gesetze. Ein einziges Spiel entscheidet über Ausscheiden und Weiterkommen. David gegen Goliath. David schafft es im Fußball doch immer wieder Goliath zu bezwingen. Speziell im DFB-Pokal erscheint es so, dass es den unterklassigen Vereinen häufig gelingt die Top-Klubs zu ärgern. Wieso ist das so?

Der Pokal hat seine eigenen Gesetze. Ein einziges Spiel entscheidet über Ausscheiden und Weiterkommen. David gegen Goliath. David schafft es im Fußball doch immer wieder Goliath zu bezwingen. Speziell im DFB-Pokal erscheint es so, dass es den unterklassigen Vereinen häufig gelingt die Top-Klubs zu ärgern. Wieso ist das so?

Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessen. Durch Deinen Besuch stimmst Du dem zu.