R² in logistischen Regressionsmodellen

Für logistische Regressionsmodelle wurde eine Vielzahl von Gütemaßen entwickelt:
z. B. McFadden’s Pseudo-R², McKelvey & Zavoina’s R², ML (Cox-Snell) R², Cragg-Uhler (Nagelkerke) R², nicht adjustiertes Count R², Akaike’s Information Criterion (AIC), Bayesian Information Criterion (BIC).

Plot einer logistischen Funktion im Intervall [-6,6]
Im Gegensatz zur linearen Regression gibt es jedoch kein Maß mit einer ähnlich eindeutigen Interpretation im Sinne erklärter Varianz, und kein Maß ist den anderen eindeutig überlegen. Scott Long (Regression Models for Categorical and Limited Dependent Variables. Thousands Oaks, London, New Delhi, 1997, S. 112) bezweifelt

“that selecting a  model that maximizes the value of a given measure of fit results in a model that is optimal in any sense other than the model having a larger value of that measure“.

Pseudo-R² ist zudem nicht für Vergleiche verschiedener logistischer Regressionsmodelle geeignet, da es nicht nur von den Effektstärken abhängt, sondern auch von den Verteilungen der Variablen (vgl. Walter Müller: Sozialstruktur und Wahlverhalten. Eine Widerrede gegen die Individualisierungsthese. Anmerkungen zu dem Beitrag von Schnell und Kohler. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie, 49. Jg., Heft 4, 1997, S. 747-761, mit Rechenbeispiel).

Diese Überlegungen sprechen für das theoriegeleitete Vorgehen beim Aufstellen logistischer Regressionsmodelle. Theorieloses Suchen nach dem „besten“ Modell, das lediglich über ein möglichst hohes (Pseudo-)R² bestimmt wird, wird u. a. als „Empirismus“ bezeichnet.

Möglich sind Modellvergleiche allerdings beim Sonderfall genisteter Modelle, d. h. wenn einem bestehenden Modell lediglich ein weiterer Prädiktor hinzugefügt wird (bei identischer Stichprobe und Fallzahl). Dann kann man aufgrund des Signifikanztests dieses Prädiktors sowie anhand des Likelihood-Ratio-Tests sagen, ob das erweiterte Modell signifikant „besser“ ist als das Modell ohne diesen Prädiktor.

Dieser Beitrag ist ein Update zu Regressionsmodelle: R², Zielsetzung / Denkmodelle

Freue mich über Kommentare!Antwort abbrechen

Hinweispflicht zu Cookies

Webseitenbetreiber müssen, um Ihre Webseiten DSGVO konform zu publizieren, ihre Besucher auf die Verwendung von Cookies hinweisen und darüber informieren, dass bei weiterem Besuch der Webseite von der Einwilligung des Nutzers in die Verwendung von Cookies ausgegangen wird.

Der eingeblendete Hinweis Banner dient dieser Informationspflicht.

Sie können das Setzen von Cookies in Ihren Browser Einstellungen allgemein oder für bestimmte Webseiten verhindern. Eine Anleitung zum Blockieren von Cookies finden Sie hier.

Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessen. Durch Deinen Besuch stimmst Du dem zu.
Die mobile Version verlassen