R² in logistischen Regressionsmodellen

Plot einer logistischen Funktion im Intervall [-6,6]

Für logistische Regressionsmodelle wurde eine Vielzahl von Gütemaßen entwickelt:
z. B. McFadden’s Pseudo-R², McKelvey & Zavoina’s R², ML (Cox-Snell) R², Cragg-Uhler (Nagelkerke) R², nicht adjustiertes Count R², Akaike’s Information Criterion (AIC), Bayesian Information Criterion (BIC).

Plot einer logistischen Funktion im Intervall [-6,6]
Plot einer logistischen Funktion im Intervall [-6,6]
Im Gegensatz zur linearen Regression gibt es jedoch kein Maß mit einer ähnlich eindeutigen Interpretation im Sinne erklärter Varianz, und kein Maß ist den anderen eindeutig überlegen. Scott Long (Regression Models for Categorical and Limited Dependent Variables. Thousands Oaks, London, New Delhi, 1997, S. 112) bezweifelt

“that selecting a  model that maximizes the value of a given measure of fit results in a model that is optimal in any sense other than the model having a larger value of that measure“.

Pseudo-R² ist zudem nicht für Vergleiche verschiedener logistischer Regressionsmodelle geeignet, da es nicht nur von den Effektstärken abhängt, sondern auch von den Verteilungen der Variablen (vgl. Walter Müller: Sozialstruktur und Wahlverhalten. Eine Widerrede gegen die Individualisierungsthese. Anmerkungen zu dem Beitrag von Schnell und Kohler. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie, 49. Jg., Heft 4, 1997, S. 747-761, mit Rechenbeispiel).



Diese Überlegungen sprechen für das theoriegeleitete Vorgehen beim Aufstellen logistischer Regressionsmodelle. Theorieloses Suchen nach dem „besten“ Modell, das lediglich über ein möglichst hohes (Pseudo-)R² bestimmt wird, wird u. a. als „Empirismus“ bezeichnet.

Möglich sind Modellvergleiche allerdings beim Sonderfall genisteter Modelle, d. h. wenn einem bestehenden Modell lediglich ein weiterer Prädiktor hinzugefügt wird (bei identischer Stichprobe und Fallzahl). Dann kann man aufgrund des Signifikanztests dieses Prädiktors sowie anhand des Likelihood-Ratio-Tests sagen, ob das erweiterte Modell signifikant „besser“ ist als das Modell ohne diesen Prädiktor.

Dieser Beitrag ist ein Update zu Regressionsmodelle: R², Zielsetzung / Denkmodelle

Freue mich über Kommentare!