SPSS Modeler: Maschinenlernen vs. Statistische Modelle

IBM SPSS Modeler: Merkmalsauswahl

Statistische Modelle beruhen auf mathematische Gleichungen, wobei ein Algorithmus die vorgegebenen Parameter schätzt. Moderner und flexibler sind Techniken zum Maschinenlernen. Sie werden auf Basis minimaler Anforderungen an die Modellstruktur und minimalen Annahmen für das Modell berechnet. Die Form der Beziehungen wird während des Lernprozesses bestimmt.

Beispiel: Lineare Regression vs. Neuronales Netzwerk (Neural Network)



Falls sich eine lineare Beziehung zwischen Zielvariable und Prädiktorvariablen eignet, werden sich die Ergebnisse des Neuronalen Netzwerks denen einen klassischen linearen Modells weitgehend annähern. Ist eine nichtlineare Beziehung besser geeignet, erstellt das Neuronale Netzwerk automatisch eine Näherung für die „korrekte“ Modellstruktur.

Der Nachteil dieser Flexibilität sei jedoch nicht verschwiegen: er besteht in schwierigerer Interpretierbarkeit. Geht es um die Beschreibung und Erklärung von Zusammenhängen, tut sich der Anwender mit klassischen statistischen Modellen leichter. Liegt der Fokus jedoch auf guten Modellprognosen, so ist das Neuronale Netzwerk in der Regel dem starreren statistischen Modell überlegen. Zudem muss sich der Anwender weniger um die zugrunde liegenden Modellvoraussetzungen (mathematische Annahmen) kümmern.

Der SPSS Modeler bietet eine große Auswahl an sogenannten „Modellierungsknoten“; die zur Verfügung stehenden Techniken sind den Bereichen der Statistik, des maschinellen Lernens und der künstlichen Intelligenz entnommen.




Freue mich über Kommentare!