Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende

Datenanalysen präsentieren: Warum ich nicht Powerpoint verwende

Was spricht gegen Powerpoint, wenn es darum geht, Ergebnisse von Datenanalysen zu präsentieren?

Hier geht es mir um drei Aspekte: Automatisierung und Reproduzierbarkeit, Dateiformate, Dateigrößen.

Powerpoint ist nicht schlecht!

Es geht mir überhaupt nicht darum, Powerpoint schlecht zu machen. Ich halte es für ein großartiges Werkzeug. Es ist einfach zu nutzen, gut geeignet für Präsentationen, und bietet viele praktische Features. Gerade dank der einfachen Nutzbarkeit wird es nicht so schnell verschwinden, und das ist völlig in Ordnung.

Hier meine Gründe, warum ich dennoch andere Formate bevorzuge, um Datenanalysen zu präsentieren.

Automatisierung / Reproduzierbarkeit

Ein typisches Vorgehen bei der Erstellung von Präsentationen aus Datenanalysen sieht so aus: Man hat (mindestens) zwei Fenster geöffnet. Im einen läuft das Datenanalyseprogramm – in meinem Fall wäre das R / RStudio, es könnte aber auch eine andere Software sein, oder ein Ordner mit Grafikdateien. Im anderen Fenster (idealerweise auf einem zweiten Bildschirm) befindet sich Powerpoint. Nun werden die Präsentationsfolien eine nach der anderen manuell mit Kernaussagen, Grafiken, Modellergebnissen etc. gefüllt.

Schlimmstenfalls (worst case scenario) kann es so laufen:

Ich baue eine Vielzahl an Grafiken in die Präsentation ein – sagen wir 50 oder 100 Diagramme. Nun wünscht sich ein Kollege / Vorgesetzter / Kunde eine kleine Änderung: sei es ein anderes Farbschema, eine andere Schriftart, eine Anpassung der Bildunterschriften (z. B. zur Datenquelle). Es könnte auch eine Datenbereinigung sein, z. B. die Eliminierung eines Ausreißer-Wertes. Das kann dann auch numerische Ergebnisse statt Grafiken betreffen, z. B. eine Menge an Kennzahlen, ganze Datentabellen etc. Bei manueller Erstellung der Folien fange ich nun (fast) von vorne an bzw. bearbeite wenigstens einen Großteil der Folien neu.

Ähnliches gilt, wenn wiederkehrende Berichte bei sich regelmäßig ändernder Datenbasis zu erstellen sind, z. B. Zwischenberichte während laufender Datenerhebung. Es erfordert manuellen Aufwand, Daten, Datenanalyse und Präsentation zu synchronisieren.

Dem möchte ich ein vollständig programmiertes Vorgehen gegenüberstellen:

Es gibt in diesem Szenario nur eine Stelle, an der ich Änderungen vornehmen muss: mein Datenanalyse-Skript, den Programmcode. Dieses Skript erzeugt Ergebnisse wie Kennzahlen, statistische Modelle und Grafiken. Und dieses Skript erzeugt direkt die Präsentation, ganz ohne Copy & Paste. Es ist offensichtlich, dass ein solches Vorgehen Fehlerquellen reduzieren und Arbeitszeit einsparen kann.

Mein bevorzugtes Werkzeug für ein solches vollständig programmiertes Vorgehen ist R Markdown – siehe den Beitrag R für Umsteiger von Excel und SPSS: Automatisierte Berichte.

Nun kann ich auf Änderungen wie Farbskalen, Schriftarten, Bildunterschriften oder bereinigte / aktualisierte Daten bequem im Skript reagieren (bei gutem Programmierstil idealerweise nur an einer Stelle im Code) und erhalte per Knopfdruck eine aktualisierte Fassung der gesamten Präsentation.

In R Markdown kann man Powerpoint als Ausgabeformat angeben

Nun spricht dieses Konzept noch nicht gegen das Powerpoint-Format, denn mit R Markdown ist es möglich, Powerpoint als Ausgabeformat auszuwählen und per Knopfdruck Präsentationen zu erstellen. Dabei kann man sogar eine Vorlage angeben, sodass die Folien dem in Powerpoint festgelegten Layout entsprechen.

Dateiformate

Ein weiterer Grund, warum ich zur Präsentation von Datenanalysen eher nicht auf Powerpoint zurückgreife, liegt in den Dateiformaten. In Powerpoint ist es zwar möglich, Videos und Animationen einzubetten, etwa wie diese:

Animation der Gapminder-Daten. Erstellt mit dem R-Paket gganimate von Thomas L. Pedersen.
Quelle: https://gganimate.com/
Empfehlung: Youtube-Videos von Hans Rosling, z. B. dieses.

Was jedoch in Standard-Powerpoint nicht ohne weiteres möglich ist, sind interaktive Elemente, die auf Javascript basieren. Hier eine Animation mit Steuerungsmöglichkeit per Schieberegler sowie Mouse-Over-Effekten, die Details zu Datenpunkten anzeigen können (hier nur das Land China, ausführlichere Infos auch zu anderen Variablen sind ohne weiteres möglich). Unten als statisches Bild, die interaktive Version liegt hier, auch im Video oben sieht man die interaktive Version in Aktion.

Animation als HTML-Widget mit Mouse-Over-Effekten und Schieberegler, um gezielt zu einem bestimmten Punkt der Animation (hier: einem bestimmten Jahr) zu navigieren.
Hier als statisches Bild. Hier geht’s zur interaktiven Version; auch im Video oben sieht man die interaktive Version in Aktion.
Quelle: https://plotly.com/r/animations/

Weiteres Anwendungsbeispiel (siehe Video): Interaktive Datensätze mit Filter- und Sortiermöglichkeit sowie Paginierung. So passen auch größere Datensätze auf eine Folie und man kann während der Präsentation gezielt Daten auswählen, die man zeigen möchte oder nach denen Zuschauer fragen.

Filter- und sortierbarer Datensatz mit Paginierung. Hier als statisches Bild – im Video oben sowie hier gibt’s die interaktive Version. Man kann nach jeder Spalte auf- oder absteigend sortieren, nach Kategorien oder Datenbereichen filtern sowie seitenweise navigieren. Platzbedarf in der Präsentation: eine Folie.

Powerpoint bietet im Gegensatz zu HTML-basierten Formaten keine direkte Javascript-Unterstützung. Es ist wohl möglich, Javascript über Addins einzubinden. Nachteil: Wird die Präsentation auf einem anderen Rechner aufgerufen, so steht die volle Funktionalität nur dann zur Verfügung, wenn dort ebenfalls die entsprechenden Addins installiert sind. Bei HTML-basierten Formaten genügt ein Browser, der heutzutage auf so gut wie jedem Rechner zur Verfügung stehen sollte.

Dateigrößen

Zuletzt noch kurz zu Dateigrößen. Ich habe wiederholt sehr große Powerpoint-Präsentationen gesehen, die viele hochauflösende Grafiken oder zum Teil eingebettete Videos enthielten. Je nach Hardware kann es dabei zu spürbaren Ladezeiten kommen, was gerade bei Live-Präsentationen unpassend sein kann. Es ist wohl möglich, externe Dateien einzubetten, die nur bei Bedarf und nicht gleich beim Start der Präsentation geladen werden, das ist jedoch nicht der Standard in Powerpoint.

In HTML-basierten Formaten wie der Präsentation aus dem Video ist es Standard, Dateien wie Videos, Animationen oder hochauflösende Grafiken aus externen Dateien einzubetten. Heutzutage besteht nahezu überall Internetzugang, sodass man die Präsentation an einer Webadresse vorbereiten kann und dann jederzeit Zugriff auf alle benötigten Dateien hat. Die Präsentation im Video, die die hier gezeigten Animationen enthält, umfasst selbst weniger als 10 Kb und ist daher verzögerungsfrei zu starten.

Dies ist jedoch nicht mein Hauptpunkt – man kann das Auslagern von Dateien auch als Nachteil sehen. In HTML ist es auch möglich, alles in eine Datei zu packen, aber meines Wissens nicht so üblich wie in Powerpoint.

Wichtiger finde ich Reproduzierbarkeit / Automatisierung bzw. das Vermeiden von Copy & Paste-Workflows, die gerade unter Zeitdruck gerne vermeidbare Fehler begünstigen, sowie die Flexibilität der Javascript-Unterstützung im Browser.

Mein aktueller Favorit: xaringan – Markdown-basierte Präsentationen

Mein aktueller Favorit ist das xaringan-Format. Es handelt sich um ein R-Paket von Yihui Xie, das auf R Markdown basiert und für die Darstellung der Präsentationen auf die Javascript-Bibliothek remark.js zugreift.

Ich weiß nicht, wie lange xaringan das Mittel der Wahl bleiben wird – gerade in diesem Bereich geht die Entwicklung rasant vonstatten. Ich halte es jedoch für wahrscheinlich, dass HTML-basierte Formate, mit welchem speziellen Tool auch immer, sich für Präsentationen noch stärker als bisher durchsetzen werden.

Die xaringan-Präsentation zum Video liegt hier auf meinem github-Profil: Warum-nicht-Powerpoint.Rmd.

Akzeptanz HTML-basierter Formate?

An einigen Stellen werden HTML-basierte Formate sicher noch auf Skepsis treffen. Wer Powerpoint oder statische Formate wie Word oder PDF gewohnt ist, wird nicht von jetzt auf gleich alles im Browser ansehen wollen. Da ist es gut zu wissen, dass man HTML-basierte Formate mit einem Klick in PDF umwandeln kann – ohne zusätzliche Software, über die Druckfunktion des Browsers. Bei Animationen wie den oben gezeigten wird dann ein Screenshot verwendet.

Wie sind Eure Erfahrungen mit der Präsentation von Datenanalysen? Welche Tools präferiert Ihr und seht Ihr Veränderungspotenzial?

Gern zeige ich automatisierte Berichtserstellung in R im Einführungskurs oder im Vertiefungskurs Ergebnisse berichten mit R.