Von SAS zu R in der Pharmaindustrie: Paradigmenwechsel!

In den Biowissenschaften und der Pharmaindustrie spielen Datenverarbeitung und insbesondere statistische Datenanalysen eine fundamentale Rolle. Seit Jahrzehnten dominierte dabei die kommerzielle Software SAS (Statistical Analysis System). Nun sind starke Initiativen auf mehreren Ebenen hin zum Einsatz von R in der Pharmaindustrie zu beobachten – verbunden mit einem erstaunlichen Kulturwandel!

pharmaverse: Logo

In den Biowissenschaften und der Pharmaindustrie spielen Datenverarbeitung und insbesondere statistische Datenanalysen eine fundamentale Rolle. Seit Jahrzehnten dominierte dabei die kommerzielle Software SAS (Statistical Analysis System). Nun sind starke Initiativen auf mehreren Ebenen hin zum Einsatz von R in der Pharmaindustrie zu beobachten.

Gründe für die jahrzehntelange SAS-Dominanz

Diese Dominanz hat mehrere Gründe, wie Gift Kenneth kürzlich auf dem Blog von Appsilon schrieb:

  • Historische Relevanz: langjährige Vertrauensverhältnisse seit den 1970er Jahren
  • Der fundierte Ruf, die regulatorischen Anforderungen, etwa von der FDA (U.S. Food and Drug Administration) genau einzuhalten
  • Abdeckung aller Arbeitsschritte klinischer Studien
  • Starke Tools für die Datenintegration aus verschiedenen Quellen
  • Flexible Anpassungsmöglichkeiten durch Programmierung

Nachteile von SAS

Allerdings brachte SAS auch schon immer einige Nachteile mit sich, die zumindest einen Anreiz setzten, offen für Alternativen zu bleiben:

  • Hohe Lizenzkosten
  • Steile Lernkurve, auch im Vergleich zu Open-Source-Software wie R
  • Begrenzte Offenheit: Als kommerzielle / proprietäre Software ist SAS weniger offen für Erweiterungen als Alternativen wie R

Wachsende Popularität von R

  • Open Source: frei verfügbar ohne Budget-Restriktionen; das erleichtert Zusammenarbeit und Innovation
  • Riesige Anzahl an Erweiterungspaketen durch globale Entwickler-Gemeinschaft
  • Flexibilität und Anpassbarkeit an individuelle Bedürfnisse / Herausforderungen

Spezifische Vorteile, R zu nutzen

  • Reproduzierbarkeit: z. B. durch Berichtsformate wie Quarto und Markdown
  • Datenvisualisierung: Enorme Möglichkeiten durch ggplot2 und zahlreiche spezialisierte Erweiterungspakete
  • Datenintegration aus verschiedenen Quellen, inklusive Datenbanken und Excel
  • Unterstützung von der weltweiten Gemeinschaft von Entwicklern und Anwendern, z. B. in zahlreichen Foren, Blogs, auf Github, auf Social Media, in Youtube-Videos etc.
  • Kosten-Effizienz durch Wegfall der Lizenzgebühren
  • Kürzere / schnellere Abläufe von Rohdaten zu Einsichten, Business Value
  • Größere Auswahl an Bewerbern / potenziellen Mitarbeitern, da es zunehmend mehr R-Experten als SAS-Experten gibt

Von SAS zu R in der Pharmaindustrie: Herausforderungen

Trotz der Vorteile ist es ein großer Schritt, Arbeitsabläufe auf R umzustellen. Dabei sind einige Herausforderungen zu meistern:

  • Regulatorische Anforderungen: Entwicklung maßgeschneiderter Prozesse, um alle Anforderungen, etwa hinsichtlich Dokumentation und Handhabung der Daten, einzuhalten
  • Datensicherheit, Schutz vertraulicher Informationen
  • Software-Validierung

Diese Hürden sind nicht trivial! In den letzten Jahren hat sich in dieser Hinsicht sehr viel getan – vor dem Hintergrund jahrzehntelang etablierter Abläufe und strenger Richtlinien stellt das einen erstaunlichen Wandel auf mehreren Ebenen dar.

R in der Pharmaindustrie: Kulturwandel, Kooperation

Neben all den technischen Aspekten finde ich dabei auch den Kulturwandel sehr beeindruckend, der von der Geheimhaltung eigener Lösungen mit Blick auf den harten Wettbewerb zu erstaunlich umfangreicher Kooperation geführt hat. Dazu zählen Konferenzen mit Erfahrungsaustausch (R/Pharma), öffentlich zugängliche Videos mit gesammelten Erfahrungen, die gemeinsame Entwicklung von R-Paketen (pharmaverse) sowie gemeinsame Arbeitsgruppen (etwa die R Submissions Working Group).

In der Charter des pharmaverse heißt es, die Branche sei nie so offen für Zusammenarbeit über Firmengrenzen hinweg gewesen wie jetzt.

R in der Pharmaindustrie: Das pharmaverse

R in der Pharmaindustrie: Logo der pharmaverse-Paketsammlung

Das pharmaverse erlangte mit der R in Pharma-Konferenz 2021 durch Ben Straub  (GSK) und Eli Miller (Atorus Research) große Popularität und ist schnell gewachsen. Dabei ist es nicht als isolierter Teil der R-Paket-Welt zu sehen, vielmehr knüpfen etliche pharmaverse-Pakete eng an bestehenden, sehr breit genutzten Paketen wie dem tidyverse an. Hier einige zentrale R-Pakete des pharmaverse:

  • {admiral} für die Erstellung von ADaM-Datensätzen (Analysis Data Model)
  • {rtables} für komplexe Tabellen, die in den Formaten ASCII, HTML, PDF oder Power Point (als flextable-Objekte) ausgegeben werden können
  • {tidytlg} zur Erstellung von Tabellen, Listen, Grafiken auf Basis des tidyverse
  • {pharmaRTF} als Brücke von bestehenden Tabellen-Paketen wie {gt} oder {huxtable} zum RTF-Format; siehe auch {r2rtf} von Merck
  • {Tplyr}, um die Zusammenfassung klinischer Studienergebnisse zu erleichtern

Weitere Infos zum pharmaverse:

R/Pharma-Konferenzen

2018 fand die erste R/Pharma-Konferenz an der Harvard-Universität statt, seitdem jährlich. Von 2020 bis 2023 wurden die Konferenzen zu 100% online durchgeführt. Auf rinpharma.com werden die Veranstaltungen ausführlich dokumentiert.

Themen im Oktober 2023 unter anderem:

  • {admiral}-Anwendung
  • Rollen-Veränderungen in der „Programmierung“ in der Pharmaindustrie
  • Interaktive Datenvisualisierungen; mehrere Workshops zu Shiny

R in der Pharmaindustrie: Arbeitsgruppen

Weitere Belege für Initiativen, die immer stärker R in der Pharmaindustrie verankern:

  • R Submissions Working Group: Arbeitsgruppe für R-basierte Zulassungsanträge für klinische Studien beim R Consortium
  • R Validation Hub: Unterstützung der Einführung von R in einem biopharmazeutischen Regulierungsumfeld, bereits über 40 teilnehmende Organisationen und Unternehmen
  • Siehe auch PHUSE: The Global Healthcare Data Science Community

Videos und Links zu R in der Pharmaindustrie

R/Pharma 2022 Day 2: Ross Farrugia. Breaking boundaries through open-source collaboration
Shifting to an Open-Source Backbone in Clinical Trials with Roche
R Validation Hub Mini-Series Part I – Risk Metrics and Risk Score Package

Mehrere kurze Videos mit Eric Nantz, Vorreiter der Shiny-Nutzung in der Pharmaindustrie

Novo Nordisk: Erfahrungen aus der ersten R-basierten Einreichung bei der FDA

Posit Blog: 5 Jahre R/Pharma-Konferenzen

Gern unterstütze ich Sie dabei, mehr mit R zu erreichen! Hier geht’s zu den Workshops. Bei inhouse-Schulungen bereite ich das Material gern in Abstimmung mit Ihnen maßgeschneidert vor.

Viel Freude und Erfolg mit R!

Freue mich über Kommentare!

Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessen. Durch Deinen Besuch stimmst Du dem zu.