NN06 - Backpropagation

Videos

Folien

Kurze Übersicht

Im Forwärtslauf (engl. forward pass oder forward propagation) wird ein einzelner Forwärtsschritt von Schicht $[l - 1]$ auf Schicht $[l]$ wie folgt berechnet: $\begin{matrix} (1) & Z^{[l]} = W^{[l]} A^{[l - 1]} + b^{[l]} \end{matrix}$ $\begin{matrix} (2) & A^{[l]} = g (Z^{[l]}) \end{matrix}$ Dabei bezeichnet $g$ die Aktivierungsfunktion (z.B. Sigmoid oder ReLU).
Im Rückwärtslauf (engl. backpropagation) werden in einem einzelnen Rückwärtsschritt von Schicht $[l]$ auf Schicht $[l - 1]$ die folgenden Gradienten berechnet:
$\begin{matrix} (3) & d Z^{[l]} := \frac{\partial J}{\partial Z^{[l]}} = d A^{[l]} * g^{'} (Z^{[l]}) \end{matrix}$ $\begin{matrix} (4) & d W^{[l]} := \frac{\partial J}{\partial W^{[l]}} = \frac{1}{m} d Z^{[l]} A^{[l - 1] T} \end{matrix}$ $\begin{matrix} (5) & d b^{[l]} := \frac{\partial J}{\partial b^{[l]}} = \frac{1}{m} \sum_{i = 1}^{m} d Z^{[l] (i)} \end{matrix}$ $\begin{matrix} (6) & d A^{[l - 1]} := \frac{\partial J}{\partial A^{[l - 1]}} = W^{[l] T} d Z^{[l]} \end{matrix}$
Dabei steht " $*$ " für die elementweise Multiplikation.
Beachten Sie:
- Der Forwärtsschirtt übernimmt $A^{[l - 1]}$ von dem vorherigen Schritt und gibt $A^{[l]}$ an den nächsten Schritt weiter.
- Der Rückwärtschritt übernimmt $d A^{[l]}$ von dem vorherigen Schritt und gibt $d A^{[l - 1]}$ an den nächsten Rückwärtsschritt weiter.

Die Aktualisierung der Parameter in Schicht $l$ erfolgt wie gewohnt durch: $\begin{matrix} (7) & W^{[l]} = W^{[l]} - α d W^{[l]} \end{matrix}$ $\begin{matrix} (8) & b^{[l]} = b^{[l]} - α d b^{[l]} \end{matrix}$ Dabei bezeichnet $α$ die Lernrate.

Übungsblätter/Aufgaben

Lernziele

(K2) Forwärts- und Rückwärtslauf in Matrix Notation mit mehreren Datenpunkten als Eingabe
(K2) Ableitung der Aktivierungsfunktionen
(K3) Berechnung der partiellen Ableitungen
(K3) Rückwärtslauf (backpropagation) für ein gegebenes MLP

Quizzes