NN04 - Overfitting und Regularisierung

Videos

Folien

Kurze Übersicht

Einführung von neuen Merkmalen in Form von nichtlienaren Kombinationen der ursprünglichen Merkmale
Erhöhung der Komplexität des Modells ermöglicht das Erfassen von nichtlinearen Beziehungen
Bemerkung: Die Hypothesenfunktion bleibt linear in den Gewichten, es wird weiterhin logistische Regression in einem erweiterten Merkmalraum durchgeführt.

Die Überanpassung (engl. Overfitting) ist eines der häufigsten und wichtigsten Probleme in ML und DL
"Was im Bereich des maschinellen Lernens Professionelle von Amateuren unterscheidet, ist ihre Fähigkeit mit Überanpassung umzugehen." [AbuMostafa2012, S. 119]
Anzeichen von Überanpassung sind geringe Trainingskosten und hohe Testkosten (Kosten auf nicht-gesehenen Daten).
Regularisierung ist eine Maßnahme gegen Überanpassung. Man kann es sich als eine Reduktion in der Komplexität des Modells vorstellen.
Der Regularisierungsparameter $λ$ ist ein Hyperparameter. Je größer der $λ$ -Wert, desto größer der Regularisierungseffekt.
Die Kostentenfunktion bei regulariserter logistischer Regression: $\begin{matrix} (1) & J = \frac{1}{m} [\sum_{i = 1}^{m} (- y^{[i]} l o g (a^{[i]}) - (1 - y^{[i]}) l o g (1 - a^{[i]})) + \frac{λ}{2} \sum_{j = 1}^{n} (w_{j}^{2})] \end{matrix}$
Die Gewichtsaktualisierung mit Regularisierungsterm: $\begin{matrix} (2) & w_{j} := w_{j} - \frac{α}{m} [\sum_{i = 1}^{m} ((a^{[i]} - y^{[i]}) x_{j}^{[i]}) + λ w_{j}] \end{matrix}$

Übungsblätter/Aufgaben

Lernziele

(K2) Erhöhung der Modell-Komplexität durch Einführung von Merkmalen höherer Ordnung
(K2) Unter- und Überanpassung
(K2) Regularisierung (Auswirkung auf Gewichte und Modell)
(K3) Gradientenabstieg für regularisierte logistische Regression

Quizzes

Quellen

[AbuMostafa2012] Learning From Data
Abu-Mostafa, Y. S. und Magdon-Ismail, M. und Lin, H., AMLBook, 2012. ISBN 978-1-6004-9006-4.
Kapitel 4