Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung

Lineare Regressionsmodelle können mit Hilfe von Polynomen auch nichtlineare Zusammenhänge abbilden. Die Modellanpassung im Sinne von R² und korrigiertem R² kann dadurch erheblich steigen. Doch ist ein solches Modell tatsächlich „besser“ als ein einfacheres? Ein Praxistest wäre, die Modellgleichung auf andere Daten anzuwenden. Oft stehen jedoch keine neuen Daten zur Verfügung, die genau die gleichen … „Was ist Overfitting? Regressionsanalyse mit R, nichtlineare Terme, Kreuzvalidierung“ weiterlesen

13 Möglichkeiten, Korrelationen zu interpretieren

Korrelation – klar, kenne ich? OK: Auf wie viele Arten können Sie Korrelationskoeffizienten interpretieren? In einem Fachartikel in The American Statistician* werden nicht weniger als 13 Möglichkeiten genannt. Es geht dabei durchgängig um den Pearson’schen Korrelationskoeffizienten, nicht um die Rangkorrelation nach Spearman oder um Unterschiede zwischen beiden. Algebraische und trigonometrische Interpretationen ohne Verteilungsannahmen Korrelation als … „13 Möglichkeiten, Korrelationen zu interpretieren“ weiterlesen

R² in logistischen Regressionsmodellen

Für logistische Regressionsmodelle wurde eine Vielzahl von Gütemaßen entwickelt: z. B. McFadden’s Pseudo-R², McKelvey & Zavoina’s R², ML (Cox-Snell) R², Cragg-Uhler (Nagelkerke) R², nicht adjustiertes Count R², Akaike’s Information Criterion (AIC), Bayesian Information Criterion (BIC). Im Gegensatz zur linearen Regression gibt es jedoch kein Maß mit einer ähnlich eindeutigen Interpretation im Sinne erklärter Varianz, und … „R² in logistischen Regressionsmodellen“ weiterlesen

Regressionsmodelle: R², Zielsetzung / Denkmodelle

Meines Erachtens gibt es zwei recht unterschiedliche Arten, mit Regressionsmodellen umzugehen. Das „empiristische“ Vorgehen Die erste, die ich wesentlich häufiger antreffe, geht von der Vorstellung aus: Regressionsmodelle sind dafür da, Zusammenhänge möglichst genau zu „erklären“ bzw. möglichst gute Prognosen zu erstellen. In dieser Denkweise ist R² (der erklärte Varianzanteil) das entscheidende Gütemaß. Wenn Studien vorgestellt werden, … „Regressionsmodelle: R², Zielsetzung / Denkmodelle“ weiterlesen