Übungsblatt: Perzeptron

(10 Punkte)

Bonus: Möglichkeiten und Grenzen sowie Auswirkungen der KI (2P)

Recherchieren Sie, welche Probleme bereits mittels Computer- bzw. Robotereinsatz gelöst werden können und welche aktuell noch ungelöst sind.

Recherchieren Sie Auswirkungen auf die Gesellschaft durch die KI, etwa durch autonomes Fahren oder durch Large Language Models (LLM).

Thema: Gefühl für bereits realisierbare Aufgaben, Chancen und Risiken, Ethik

NN.Perzeptron.01: Entscheidungsgrenze (2P)

(1P) Betrachten Sie das durch den Gewichtsvektor $(w_{0}, w_{1}, w_{2})^{T} = (2, 1, 1)^{T}$ gegebene Perzeptron. Zeichnen Sie die Trennebene und markieren Sie den Bereich, der mit $+ 1$ klassifiziert wird.
(1P) Welche der folgenden Perzeptrons haben die selbe Trennebene? Welche weisen exakt die gleiche Klassifikation auf?
- $(w_{0}, w_{1}, w_{2})^{T} = (1, 0.5, 0.5)^{T}$
- $(w_{0}, w_{1}, w_{2})^{T} = (200, 100, 100)^{T}$
- $(w_{0}, w_{1}, w_{2})^{T} = (\sqrt{2}, \sqrt{1}, \sqrt{1})^{T}$
- $(w_{0}, w_{1}, w_{2})^{T} = (- 2, - 1, - 1)^{T}$

Thema: Verständnis Interpretation Perzeptron (Trennebene/Entscheidungsgrenze)

NN.Perzeptron.02: Logische Funktionen als Perzeptron (2P)

(1.5P) Das Perzeptron kann zur Ausführung zahlreicher logischer Funktionen verwendet werden. Implementieren Sie die binären Logikfunktionen UND, ODER und KOMPLEMENT und demonstrieren Sie Ihre Implementierung in der Übung/im Praktikum.
(0.5P) Eine grundlegende Einschränkung des Perzeptrons besteht darin, dass es die EXKLUSIV-ODER-Funktion nicht implementieren kann. Erklären Sie den Grund für diese Einschränkung.

Thema: Verständnis Perzeptron

NN.Perzeptron.03: Perzeptron Lernalgorithmus (6P)

Ziel dieser Aufgabe ist es, mit Hilfe eines Experiments ein Gefühl für die Laufzeit des Perzeptron-Lernalgorithmus zu bekommen und eine Art empirische Approximation zu bestimmen.

Datensatz (1P)

Konstruieren Sie Ihren eigenen Datensatz $D$ mit $m = 10$ gleichförmig verteilten Zufallspunkten aus dem Bereich $X = [- 1, 1] \times [- 1, 1]$ .
Wählen Sie auf ähnliche Weise zwei zufällige, gleichmäßig verteilte Punkte aus dem Bereich $[- 1, 1] \times [- 1, 1]$ . Verwenden Sie die Gerade, die durch diese zwei Punkte verläuft, als die Entscheidungsgrenze Ihrer Zielfunktion $f$ . Sie können die positiv beschriftete Seite beliebig festlegen.
Werten Sie die Zielfunktion für jeden Datenpunkt $x^{(j)}$ aus, um die entsprechenden Beschriftungen (Ausgangslabel) $y^{(j)}$ zu erhalten.

Training (3P)

Führen Sie nun den Perzeptron-Lernalgorithmus $1000$ mal hintereinander aus. Initialisieren Sie jedes Mal die Gewichte mit $0$ . Wählen Sie in jedem Lernschritt einen Punkt $x^{(i)}$ zufällig aus der Menge der falsch klassifizierten Punkte und aktualisieren Sie die Gewichte entsprechend der folgenden Formel: $w := w + α (y^{(i)} - h (x^{(i)})) x^{(i)}$

Nehmen Sie $α = 1$ als Lernrate. Halten Sie für jeden Durchlauf fest, wie viele Schritte der Algorithmus benötigt, um zu der endgültigen Hypothese $h^{*} (x)$ zu konvergieren. Berechnen Sie am Ende die durchschnittliche Anzahl von benötigten Schritten. In welcher Größenordnung liegt sie?

Experimente (2P)

Wiederholen Sie das obige Experiment mit $m = 100$ und $m = 1000$ Datenpunkten, jeweils ein Mal mit den Lernraten $α = 1$ und $α = 0.1$ . In welcher Größenordnung liegt die durchschnittliche Anzahl von benötigten Schritten in diesen Fällen?

Um eine zuverlässigere Schätzung zu erhalten, können Sie dasselbe Experiment mehrfach mit anderen zufällig generierten Datensätzen derselben Größe $m$ wiederholen und danach den Durchschnitt über alle Wiederholungen betrachten.

Visualisierung (optional)

Halten Sie während des Trainings die Anzahl der falsch klassifizierten Punkte fest und veranschaulichen Sie anschließend den Lernprozess mit Hilfe eines zweidimensionalen Plots.
Visualisieren Sie (auf eine geeignete Weise) Meilenstein 2.1, wie sich die Entscheidungsrenze während des Trainings verändert.

Sie können das folgende Jupyter Notebook als Startpunkt benutzen.

Idee nach Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin. 2012. Learning From Data. AMLBook.