Suche mit Tiefensuche

TL;DR

Die Tiefensuche gehört zu den "Uninformierten Suchverfahren": Es werden keine weiteren Pfadkosten, sondern nur die Anzahl der Schritte berücksichtigt.

Die Tiefensuche entsteht, wenn man bei der Tree-Search oder der Graph-Search für die Datenstruktur einen Stack benutzt: Expandierte Nachfolger werden immer oben auf den Stack gelegt, und der nächste zu expandierende Knoten wird oben vom Stack genommen. Dadurch verfolgt die Tiefensuche einen Pfad immer erst in die Tiefe.

Bei Sackgassen erfolgt automatisch ein Backtracking, d.h. es wird zum letzten Knoten mit einer Alternative zurückgegangen. Dies liegt daran, dass bei einer Sackgasse keine Nachfolger expandiert und oben auf den Stack gelegt werden.

Videos (YouTube)

VL Tiefensuche

Videos (HSBI-Medienportal)

VL Tiefensuche

Lernziele

(K2) Verwendete Datenstrukturen
(K2) Algorithmische Abläufe, Terminierung
(K2) Optimalität, Vollständigkeit und Komplexität
(K3) Uninformierte Suchverfahren: Tiefensuche

Hole das Buch

Das Beispiel ist ein Büroflur in der Uni. Neben den Büros gibt es eine Bibliothek und einen Kopiererraum, wo auch der Roboter sich gerade aufhält. Die Aufgabe für den Roboter lautet: Hole das Buch aus der Bibliothek (und bringe es zum Kopier). (Damit das Beispiel und der sich daraus ergebende Problemgraph nicht zu groß und zu unübersichtlich werden, soll das Ziel hier darin liegen, dass der Roboter das Buch in der Bibliothek aufnimmt.)

Es stehen zwei Aktionen zur Verfügung:

Der Roboter kann von einem in den nächsten Raum wechseln (Kosten siehe Pfeile)
Der Roboter kann das Buch aufnehmen (Kosten: 3)

Dabei sind die Durchgänge teilweise nur in einer Richtung zu benutzen (Pfeilrichtung).

Problemgraph zum Kopiererbeispiel

=> Problemlösen == Suche im Graphen

Uninformierte ("blinde") Suche:

Keine Informationen über die Kosten eines Pfades: Nur die Pfadlänge (Anzahl der Schritte) zählt.

Varianten:

Tiefensuche
Breitensuche

Anmerkungen Wegesuche (Landkarte)

Bei der Wegesuche hat man den Problemgraphen bereits durch die Orte und die Verbindungen (Straßen) zwischen ihnen gegeben. Es gibt nur eine ausführbare Aktion: "fahre nach".

Dabei können nur die Anzahl der Zwischenstationen auf dem Weg gezählt werden ("uninformierte Suche"), oder man ordnet den Kanten Kosten zu (bei der Wegesuche wären dies die Entfernungen zwischen den Orten oder die Zeit, die man von A nach B braucht) und landet damit bei der "informierten Suche".

Normalerweise hat man eine Ordnung auf den Aktionen, d.h. für einen Knoten ergibt sich daraus eine Reihenfolge, in der die Aktionen angewendet werden und die Nachfolger expandiert werden. Bei der Wegesuche hat man dies nicht, insofern muss man willkürlich eine Ordnung festlegen. In dieser Veranstaltung ist dies die alphabetische Reihenfolge der Knoten (Orte).

Tiefensuche (TS, DFS)

Erinnerung Tree-Search

Füge Startknoten in leere Datenstruktur (Stack, Queue, ...) ein
Entnehme Knoten aus der Datenstruktur:
- Knoten ist gesuchtes Element: Abbruch, melde "gefunden"
- Expandiere alle Nachfolger des Knotens und füge diese in die Datenstruktur ein
Falls die Datenstruktur leer ist: Abbruch, melde "nicht gefunden"
Gehe zu Schritt 2

=> Was passiert, wenn wir einen Stack einsetzen?

Bemerkungen

Nachfolger eines Knotens: Alle von diesem Zustand durch Aktionen erreichbare Zustände
Suchalgorithmus mit Stack als Datenstruktur => Tiefensuche
- Zu betrachtender Knoten in Schritt 2 wird oben vom Stack genommen
- Expandierte Knoten werden in Schritt 2.a oben auf den Stack gelegt Dabei i.A. die vorgegebene Reihenfolge der Nachfolgeknoten beachten!
Auswirkung: Weg wird in die Tiefe verfolgt (deshalb "Tiefensuche")
Im [Russell2020] wird die Datenstruktur zum Halten der zu expandierenden Knoten (also hier im Fall der Tiefensuche der Stack) auch "Frontier" genannt.
Backtracking: Wenn der Weg in eine Sackgasse führt, d.h. ein Knoten keine Nachfolger hat, werden bei der Expansion des Knotens keine Nachfolger auf den Stack gelegt. Die Evaluation des nächsten Knotens auf dem Stack bewirkt deshalb ein Zurückspringen im Suchbaum zum letzten Knoten auf dem aktuellen Weg mit noch offenen Alternativen ...

Konventionen für diese Lehrveranstaltung

In der Beschreibung der Algorithmen werden häufig nur die letzten Knoten der partiellen Wege in den Datenstrukturen mitgeführt (das gilt auch für die Beschreibung im [Russell2020]). Dies erschwert die Nachvollziehbarkeit, wenn man die Queue oder den Stack schrittweise aufschreibt. Deshalb wird für diese Veranstaltung die Konvention eingeführt, immer die partiellen Wege aufzuschreiben.

Nicht Bestandteil der Algorithmen, dient aber der Nachvollziehbarkeit: Expandierte Knoten sollen alphabetisch sortiert an der korrekten Stelle in der Datenstruktur auftauchen, dabei soll aber natürlich die Reihenfolge der ursprünglich in der Datenstruktur enthaltenen Knoten nicht modifiziert werden. (Bei "echten" Problemen wird die Reihenfolge der expandierten Nachfolger in der Regel durch eine Reihenfolge der anwendbaren Operationen bestimmt.)

Weitere Hinweise

Die Tiefensuche wurde zufällig am Beispiel Tree-Search eingeführt. Man kann auch Graph-Search einsetzen. Wichtig ist nur, dass als Datenstruktur ein Stack genutzt wird.
Bei Tree-Search werden bereits besuchte Knoten u.U. immer wieder besucht. Zyklen im aktuell entwickelten Pfad sind also möglich! Außerdem sind mehrere Wege zum selben (Zwischen-/End-) Knoten in der Datenstruktur möglich!
Im [Russell2020] wird der Begriff "Backtracking" für den rekursiven Tiefensuche-Algorithmus verwendet. Dies steht im Gegensatz zum üblichen Sprachgebrauch in der KI!

Tiefensuche (rekursive Variante)

Startknoten ist gesuchtes Element: Abbruch, melde "gefunden"
Für jeden Nachfolger des Startknotens:
- Rufe Tiefensuche für aktuellen (Nachfolger-) Knoten auf
- Ergebnis "gefunden": Abbruch, melde "gefunden"
Abbruch, melde "nicht gefunden"

Bemerkungen

Eigenschaften wie "normale" Tiefensuche
Einfacher zu implementieren: Nutzung des Stacks wird auf den Compiler verlagert (Funktionsaufruf, Stack des Prozesses ...)
Speicherbedarf: Für jeden Knoten wird nur der nächste Knoten expandiert, plus Speicher für die Funktion

Eigenschaften der Tiefensuche

Siehe Breitensuche

Wrap-Up

Uninformierte Suchverfahren
- Keine weiteren Pfadkosten (nur Anzahl der Schritte)
- Tiefensuche: Verfolge einen Pfad zuerst in die Tiefe
- Backtracking bei Sackgassen (automatisch durch den Stack)

Quizzes

Selbsttest Tiefensuche (ILIAS)

Übungsblätter/Aufgaben

Übungsblatt: Problemlösen, Suche

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Tiefensuche: Abschnitt 3.4.3

Suche mit Breitensuche

TL;DR

Die Breitensuche gehört zu den "Uninformierten Suchverfahren": Es werden keine weiteren Pfadkosten, sondern nur die Anzahl der Schritte berücksichtigt.

Die Breitensuche entsteht, wenn man bei der Tree-Search oder der Graph-Search für die Datenstruktur eine Queue benutzt: Expandierte Nachfolger werden immer hinten in die Queue eingefügt, und der nächste zu expandierende Knoten wird vorn aus der Queue genommen. Dadurch wird bei der Breitensuche der Suchbaum ebenenweise entwickelt.

Videos (YouTube)

VL Breitensuche

Videos (HSBI-Medienportal)

VL Breitensuche

Lernziele

(K2) Verwendete Datenstrukturen
(K2) Algorithmische Abläufe, Terminierung
(K2) Optimalität, Vollständigkeit und Komplexität
(K3) Uninformierte Suchverfahren: Breitensuche

Hole das Buch

=> Problemlösen == Suche im Graphen

Uninformierte ("blinde") Suche:

Keine Informationen über die Kosten eines Pfades: Nur die Pfadlänge (Anzahl der Schritte) zählt.

Varianten:

Tiefensuche
Breitensuche

Breitensuche (BS, BFS)

Erinnerung Graph-Search

Füge Startknoten in leere Datenstruktur (Stack, Queue, ...) ein
Entnehme Knoten aus der Datenstruktur:
- Knoten ist gesuchtes Element: Abbruch, melde "gefunden"
- Markiere aktuellen Knoten, und
- Expandiere alle Nachfolger des Knotens und füge alle unmarkierten Nachfolger, die noch nicht in der Datenstruktur sind, in die Datenstruktur ein
Falls die Datenstruktur leer ist: Abbruch, melde "nicht gefunden"
Gehe zu Schritt 2

=> Was passiert, wenn wir eine Queue einsetzen?

Bemerkungen

Nachfolger eines Knotens: Alle von diesem Zustand durch Aktionen erreichbare Zustände
Suchalgorithmus mit Queue als Datenstruktur => Breitensuche
- Zu betrachtender Knoten in Schritt 2 wird vorn aus der Queue genommen
- Expandierte Knoten werden in Schritt 2.a hinten in die Queue eingefügt Dabei i.A. die vorgegebene Reihenfolge der Nachfolgeknoten beachten!
Auswirkung: Suchbaum wird ebenenweise aufgebaut (deshalb "Breitensuche")
Graph-Search: Markierte Knoten müssen geeignet gespeichert werden: separate Datenstruktur => Aufwand!

Konventionen für diese Lehrveranstaltung

In der Beschreibung der Algorithmen werden häufig nur die letzten Knoten der partiellen Wege in den Datenstrukturen mitgeführt (das gilt auch für die Beschreibung im [Russell2020]). Dies erschwert die Nachvollziehbarkeit, wenn man die Queue oder den Stack schrittweise aufschreibt. Deshalb wird für diese Veranstaltung die Konvention eingeführt, immer die partiellen Wege aufzuschreiben.

Nicht Bestandteil der Algorithmen, dient aber der Nachvollziehbarkeit: Expandierte Knoten sollen alphabetisch sortiert an der korrekten Stelle in der Datenstruktur auftauchen, dabei soll aber natürlich die Reihenfolge der ursprünglich in der Datenstruktur enthaltenen Knoten nicht modifiziert werden. (Bei "echten" Problemen wird die Reihenfolge der expandierten Nachfolger in der Regel durch eine Reihenfolge der anwendbaren Operationen bestimmt.)

Weitere Hinweise

Die Breitensuche wurde zufällig am Beispiel Graph-Search eingeführt. Man kann auch die Tree-Search-Variante einsetzen. Wichtig ist nur, dass als Datenstruktur eine Queue genutzt wird.
Im [Russell2020] wird die Breitensuche ebenfalls auf der Basis des Graph-Search-Algorithmus eingeführt. Allerdings wird die Abbruchbedingung modifiziert: Die Zielbedingung wird nicht erst (wie bei Graph-Search eigentlich definiert) geprüft, wenn ein Knoten aus der Queue entnommen wird, sondern bereits bei der Erzeugung der Nachfolgerknoten (vor dem Einfügen in die Queue). Dadurch spart man sich die Expansion einer zusätzlichen Ebene: Die Komplexität wäre in diesem Fall "nur" $O(b^{d})$.

Eigenschaften Breitensuche vs. Tiefensuche

	Tiefensuche	Breitensuche
Vollständigkeit	nein¹	ja²
Optimalität	nein	ja
Zeitkomplexität	$O(b^m)$	$O(b^{d+1})$
Speicherkomplexität	$O(bm)$	$O(b^{d+1})$

Zeitkomplexität: maximal zu expandierende Knotenzahl
Speicher:
- TS: in jeder Tiefe weitere $b$ Knoten speichern
- BS: alle Knoten einer Ebene im Speicher halten³

b: Verzweigungsfaktor, d: Ebene d. höchsten Lösungsknotens, m: Länge d. längsten Pfades

Praxisvergleich Breitensuche vs. Tiefensuche

Breitensuche: Annahme: $b=10$, 10.000 Knoten/s, 1.000 Byte/Knoten

Tiefe	exp. Knoten	Zeit	Speicher
2	$10^3$	0.1 s	1 MB
4	$10^5$	10 s	100 MB
6	$10^7$	20 min	10 GB
8	$10^9$	30 h	1 TB
10	$10^{11}$	130 d	100 TB

Tiefensuche: Annahme: längster Pfad (Tiefe) $m=1000$

=> Speicherbedarf ca. 10 MB

Wrap-Up

Uninformierte Suchverfahren
- Keine weiteren Pfadkosten (nur Anzahl der Schritte)
- Breitensuche: Verfolge alle Pfade (baue den Suchbaum ebenenweise auf)

gilt für Tree-Search-Variante; vollständig in Graph-Search-Variante bei endlichem Suchraum ↩︎
falls b endlich ↩︎
$O(b^{d})$ mit vorgezogener Zielprüfung (vgl. [Russell2020]) ↩︎

Quizzes

Selbsttest Breitensuche (ILIAS)

Übungsblätter/Aufgaben

Übungsblatt: Problemlösen, Suche

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Breitensuche: Abschnitt 3.4.1

Suche mit Branch-and-Bound

TL;DR

Branch-and-Bound gehört zu den "Informierten Suchverfahren": Es werden (reale) Pfadkosten statt der Anzahl der Schritte berücksichtigt.

Branch-and-Bound entsteht, wenn man bei der Tree-Search oder der Graph-Search für die Datenstruktur eine sortierte Queue (Prioritätsqueue) benutzt: Expandierte Nachfolger werden immer hinten in die Queue eingefügt, diese wird nach den Kosten der partiellen Pfade sortiert und der nächste zu expandierende Knoten (d.h. der bisher günstigste partielle Weg) wird vorn aus der Queue genommen. Branch-and-Bound arbeitet mit den bisher entstandenen (realen) Kosten der partiellen Wege.

Videos (YouTube)

VL Branch-and-Bound

Videos (HSBI-Medienportal)

VL Branch-and-Bound

Lernziele

(K2) Verwendete Datenstrukturen
(K2) Algorithmische Abläufe, Terminierung
(K2) Optimalität, Vollständigkeit und Komplexität
(K2) Bedeutung nicht-negativer Kosten für Branch-and-Bound
(K3) Informierte Suchverfahren: Branch-and-Bound

Hole das Buch

=> Problemlösen == Suche im Graphen

Informierte Suche: Nutzung der Kostenfunktion:

Gesamtkosten: $f(n) = g(n) + h(n)$

$n \in S$ auf aktuellem Weg erreichter Knoten
$g(n)$ tatsächliche Kosten für Weg vom Start bis Knoten $n$
$h(n)$ geschätzte Restkosten für Weg von Knoten $n$ zum Ziel => $h(n)$ wird auch "heuristische Funktion" oder "Heuristik" genannt

Varianten:

Branch-and-Bound
Best First
A*

Branch-and-Bound (BnB)

Variante der Breitensuche mit Kosten

Idee: Expandiere den bisher günstigsten partiellen Weg
Kostenfunktion: $f(n) = g(n)$
Datenstruktur: sortierte Queue (Prioritätsqueue)
Voraussetzung: alle Aktionen haben positive Kosten (jeden Knoten $n$ gilt: $g(n) > 0$)

Hinweis: Die Branch-and-Bound-Suche taucht im [Russell2020] als Erweiterung der "Uniformen Suche" auf ...

BnB: Finde einen Weg von A nach H

Bemerkungen zu BnB mit Graph-Search

Graph-Search fordert: Expandierte Nachfolgerknoten, die schon in der Queue sind, sollen nicht (erneut) in die Queue aufgenommen werden.

Problem dabei: Was ist mit den Kosten?! Der neu expandierte Weg könnte günstiger sein als der schon in der Queue enthaltene.
Lösung (vgl. Optimierungsmöglichkeiten für A*):

Füge zunächst alle neu expandierten partiellen Pfade (mit unmarkierten Endknoten) in die Queue ein, sortiere diese und behalte von mehreren Pfaden zum gleichen Knoten nur den jeweils günstigsten in der Queue

Pfade, deren Endknoten bereits früher im Pfad vorkommt (Schleifen), werden bei Graph-Search in Schritt 2 nicht in die Queue aufgenommen (der Endknoten wäre bei einer Schleife ja bereits markiert und der neue Pfad würde bei Graph-Search nicht weiter beachtet).

Das Einfärben ist kein Problem, da nur der jeweils günstigste Knoten aus der Queue genommen, gefärbt und expandiert wird. D.h. alle anderen Wege sind zu diesem Zeitpunkt bereits teurer. Wenn man nun (später) über einen anderen Weg zu einem bereits gefärbten Knoten kommt, kann der neue Weg nicht günstiger sein (positive Kosten vorausgesetzt).

Konventionen für diese Lehrveranstaltung

In der Beschreibung der Algorithmen werden häufig nur die letzten Knoten der partiellen Wege in den Datenstrukturen mitgeführt (das gilt auch für die Beschreibung im [Russell2020]). Dies erschwert die Nachvollziehbarkeit, wenn man die Queue oder den Stack schrittweise aufschreibt. Deshalb wird für diese Veranstaltung die Konvention eingeführt, immer die partiellen Wege aufzuschreiben.

Auf dem Papier sortiert sich die Queue schlecht, deshalb können Sie darauf verzichten, wenn Sie den im nächsten Schritt zu expandierenden Weg unterstreichen. Wer nicht mit Unterstreichen arbeiten will, muss eben dann manuell sortieren ...

Wenn bei der Graph-Search-Variante ein Weg nicht in die Queue aufgenommen wird, weil bereits ein anderer (günstigerer) Weg zum selben (Zwischen-/End-) Knoten bereits in der Queue enthalten ist, schreiben Sie dies geeignet auf. Dies gilt auch für den analogen Fall, wenn ein Weg aus der Queue entfernt wird, weil ein günstigerer Weg zum selben (Zwischen-/End-) Knoten eingefügt werden soll.

Eigenschaften von BnB

Siehe A*

Wrap-Up

Informierte Suchverfahren
- Nutzen reale Pfadkosten und/oder Schätzungen der Restkosten
- Branch-and-Bound: nur reale Pfadkosten $g(n)$

Quizzes

Selbsttest Branch-and-Bound (ILIAS)

Übungsblätter/Aufgaben

Übungsblatt: Problemlösen, Suche

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Branch-and-Bound (Uniforme Suche): Abschnitt 3.4.2

Suche mit Best First

TL;DR

Best First gehört wie Branch-and-Bound zu den "Informierten Suchverfahren": Es werden Pfadkosten (in diesem Fall Schätzungen) statt der Anzahl der Schritte berücksichtigt.

Best First arbeitet algorithmisch wie Branch-and-Bound, allerdings werden immer nur die geschätzten Restkosten eines Knotens zum Ziel berücksichtigt.

Videos (YouTube)

VL Best First

Videos (HSBI-Medienportal)

VL Best First

Lernziele

(K1) Verwendete Datenstrukturen
(K2) Algorithmische Abläufe, Terminierung
(K2) Optimalität, Vollständigkeit und Komplexität
(K3) Informierte Suchverfahren Best-First

Hole das Buch

=> Problemlösen == Suche im Graphen

Informierte Suche: Nutzung der Kostenfunktion:

Gesamtkosten: $f(n) = g(n) + h(n)$

$n \in S$ auf aktuellem Weg erreichter Knoten
$g(n)$ tatsächliche Kosten für Weg vom Start bis Knoten $n$
$h(n)$ geschätzte Restkosten für Weg von Knoten $n$ zum Ziel => $h(n)$ wird auch "heuristische Funktion" oder "Heuristik" genannt

Varianten:

Branch-and-Bound
Best First
A*

Best-First (BF, BFS)

Idee: Expandiere den partiellen Weg, der verspricht, dem Ziel am nächsten zu sein (Heuristik)
Kostenfunktion: $f(n) = h(n)$
Datenstruktur: sortierte Queue (Prioritätsqueue)
Voraussetzungen: $h(n)$ positiv, $h(n) = 0$ für den Zielknoten

Konventionen BF

In der Beschreibung der Algorithmen werden häufig nur die letzten Knoten der partiellen Wege in den Datenstrukturen mitgeführt (das gilt auch für die Beschreibung im [Russell2020]). Dies erschwert die Nachvollziehbarkeit, wenn man die Queue oder den Stack schrittweise aufschreibt. Deshalb wird für diese Veranstaltung die Konvention eingeführt, immer die partiellen Wege aufzuschreiben.

Auf dem Papier sortiert sich die Queue schlecht, deshalb können Sie darauf verzichten, wenn Sie den im nächsten Schritt zu expandierenden Weg unterstreichen. Wer nicht mit Unterstreichen arbeiten will, muss eben dann manuell sortieren ...

Wenn bei der Graph-Search-Variante ein Weg nicht in die Queue aufgenommen wird, weil bereits ein anderer (günstigerer) Weg zum selben (Zwischen-/End-) Knoten bereits in der Queue enthalten ist, schreiben Sie dies geeignet auf. Dies gilt auch für den analogen Fall, wenn ein Weg aus der Queue entfernt wird, weil ein günstigerer Weg zum selben (Zwischen-/End-) Knoten eingefügt werden soll.

Eigenschaften von BF

Siehe A*

Wrap-Up

Informierte Suchverfahren
- Nutzen reale Pfadkosten und/oder Schätzungen der Restkosten
- Best-First: nur Schätzungen $h(n)$

Quizzes

Selbsttest Best First (ILIAS)

Challenges

Betrachten Sie folgende Landkarte und Restwegschätzungen:

Quelle: MapGermanyGraph.svg by Regnaron and Jahobr on Wikimedia Commons (Public Domain)

Finden Sie mit der Best-First-Suche jeweils einen Weg von Würzburg nach München. Vergleichen Sie das Ergebnis mit der Gradienten-Suche.

Übungsblätter/Aufgaben

Übungsblatt: Problemlösen, Suche

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Best First: Abschnitt 3.5.1, Heuristiken: Kapitel 3.6

Suche mit A*

TL;DR

A* zählt zu den Verfahren der informierten Suche. Dabei verwendet A* sowohl die realen Pfadkosten als auch die Schätzungen der Restkosten, d.h. die Kostenfunktion für A* ist $f(n) = g(n)+h(n)$.

A* ist vollständig und optimal, allerdings muss die Heuristik bei der Tree-Search-Variante zulässig sein (d.h. sie muss unterschätzen, beispielsweise die Luft-Linie) und bei der Graph-Search-Variante muss sie konsistent sein (d.h. für jeden Knoten die Dreiecks-Ungleichung erfüllen).

A* hat wie BnB exponentiellen Aufwand. Durch die zusätzliche Verwendung der Heuristik werden die partiellen Pfade in der Queue aber geschickter sortiert, so dass A* in der Regel mit weniger Suchschritten als BnB auskommt.

Videos (YouTube)

VL A*

Videos (HSBI-Medienportal)

VL A*

Lernziele

(K2) Verwendete Datenstrukturen
(K2) Algorithmische Abläufe, Terminierung
(K2) Optimalität, Vollständigkeit und Komplexität
(K2) Bedingung(en) an Restkostenabschätzung bei A*
(K3) Informierte Suchverfahren A*

Hole das Buch

=> Problemlösen == Suche im Graphen

Informierte Suche: Nutzung der Kostenfunktion:

Gesamtkosten: $f(n) = g(n) + h(n)$

$n \in S$ auf aktuellem Weg erreichter Knoten
$g(n)$ tatsächliche Kosten für Weg vom Start bis Knoten $n$
$h(n)$ geschätzte Restkosten für Weg von Knoten $n$ zum Ziel => $h(n)$ wird auch "heuristische Funktion" oder "Heuristik" genannt

Varianten:

A*-Suche

Kombination aus Branch-and-Bound und Best-First-Suche
Kostenfunktion: $f(n) = g(n) + h(n)$
Datenstruktur: sortierte Queue (Prioritätsqueue)
Voraussetzung:
1. Alle Aktionen haben positive Kosten ($g(n) \ge \epsilon$)
2. Heuristik $h(n)$ muss zulässig/konsistent sein

Konventionen für diese Lehrveranstaltung

In der Beschreibung der Algorithmen werden häufig nur die letzten Knoten der partiellen Wege in den Datenstrukturen mitgeführt (das gilt auch für die Beschreibung im [Russell2020]). Dies erschwert die Nachvollziehbarkeit, wenn man die Queue oder den Stack schrittweise aufschreibt. Deshalb wird für diese Veranstaltung die Konvention eingeführt, immer die partiellen Wege aufzuschreiben.

Notieren Sie die Bestandteile der Kosten für jeden partiellen Weg in der Queue einzeln: "$g(n) + h(n) = f(n)$". Das erleichtert Ihnen die weiteren Schritte, da Sie dort ja nur mit $g(n)$ weiter rechnen dürfen. Gleichzeitig erleichtert es die Nachvollziehbarkeit.

Auf dem Papier sortiert sich die Queue schlecht, deshalb können Sie darauf verzichten, wenn Sie den im nächsten Schritt zu expandierenden Weg unterstreichen. Wer nicht mit Unterstreichen arbeiten will, muss eben dann manuell sortieren ...

Wenn bei der Graph-Search-Variante ein Weg nicht in die Queue aufgenommen wird, weil bereits ein anderer (günstigerer) Weg zum selben (Zwischen-/End-) Knoten bereits in der Queue enthalten ist, schreiben Sie dies geeignet auf. Dies gilt auch für den analogen Fall, wenn ein Weg aus der Queue entfernt wird, weil ein günstigerer Weg zum selben (Zwischen-/End-) Knoten eingefügt werden soll.

A*-Suche -- Anforderungen an Heuristik (Tree-Search)

Tree-Search-Variante: Die Heuristik muss zulässig sein:

Seien $h^\star(n)$ die tatsächlichen optimalen Restkosten von einem Knoten $n$ zum nächsten Ziel.
Dann muss für jeden beliebigen Knoten $n$ gelten: $$h(n) \le h^\star(n)$$
Außerdem muss gelten:
- $h(n) \ge 0$ für jeden Knoten $n$
- $h(n) = 0$ für jeden Zielknoten $n$

=> Beispiel: Luftlinie als Abschätzung

Hinweis: Im der englischen Ausgabe des [Russell2020] wird die zulässige Heuristik auch "admissible heuristic" genannt.

A* ist optimal

A* (Tree-Search-Variante) mit zulässiger Heuristik ist optimal.

Beweis siehe Übung :-)

Einfache Verbesserungen A* (Tree-Search)

Dynamische Programmierung: Behalte von mehreren Pfaden zum gleichen Knoten nur den günstigsten in der Queue
Pfade, deren Endknoten bereits früher im Pfad vorkommt (Schleifen), werden in Schritt 2 nicht in die Queue aufgenommen
Übergang zur Graph-Search-Variante und Markierung von Knoten

=> Achtung: Dann schärfere Anforderungen an Heuristik (Konsistenz)

A*-Suche -- Anforderungen an Heuristik (Graph-Search)

Graph-Search-Variante: Die Heuristik muss konsistent sein:

Für jeden Knoten $n$ und jeden durch eine Aktion $a$ erreichten Nachfolger $m$ gilt: $$h(n) \le c(n,a,m) + h(m)$$ mit $c(n,a,m)$ Schrittkosten für den Weg von $n$ nach $m$ mit Aktion $a$.

Außerdem muss gelten:

$h(n) \ge 0$ für jeden Knoten $n$
$h(n) = 0$ für jeden Zielknoten $n$

=> Eine konsistente Heuristik ist gleichzeitig zulässig.

Hinweis: Im der englischen Ausgabe des [Russell2020] wird die konsistente Heuristik auch "consistent heuristic" genannt.

Eigenschaften Branch-and-Bound, Best-First, A*

	Branch-and-Bound	Best-First	A*
Kosten	$f(n) = g(n)$	$f(n) = h(n)$	$f(n) = g(n) + h(n)$
Vollständigkeit	ja¹	nein²	ja
Optimalität	ja	nein	ja
Aufwand	exponentiell	exponentiell	exponentiell
Bemerkung	Probiert erst alle "kleinen" Pfade	Suchverlauf stark abh. v. Heuristik	Heuristik: zulässig bzw. konsistent

Wrap-Up

Informierte Suchverfahren
- Nutzen reale Pfadkosten und/oder Schätzungen der Restkosten
- A*: komplette Kostenfunktion $f(n) = g(n)+h(n)$ => besondere Anforderungen an die Heuristik! (Tree-Search: zulässige Heuristik; Graph-Search: konsistente Heuristik)
Ausblick auf Verbesserungen der vorgestellten Suchverfahren:
- Beschränkung der Suchtiefe ("Depth-Limited-Search")
- Iterative Vertiefung der Suchtiefe ("Iterative-Deepening-Search"), beispielsweise IDA* ("Iterative-Deepening A*")
- Beschränkung des verwendeten Speichers, beispielsweise SMA* ("Simplified Memory-Bounded A*")

BnB vollständig: Kosten größer Epsilon (positiv) ↩︎
gilt für Tree-Search-Variante; vollständig bei Graph-Search und endlichen Problemräumen ↩︎

Quizzes

Selbsttest A* (ILIAS)

Challenges

Informierte und uninformierte Suche

Betrachten Sie folgendes Problem:

Dargestellt ist eine typische Büroumgebung mit verschiedenen Räumen und einem Flur. Die Pfeile in den Durchgängen geben an, in welche Richtung der jeweilige Durchgang durchschritten werden darf. Die Werte an den Pfeilen geben die Kosten für den Übergang von einem Raum in den anderen an.

Ein Roboter Robbi, der sich zunächst im Kopierer-Raum aufhält, soll den Weg zur Bibliothek finden und dort das Buch aufnehmen. Der Roboter kann sich immer nur entlang den Pfeilen in einen Nachbarraum bewegen (Aktion move). Die Kosten für das Aufnehmen des Buches betragen 3 Einheiten (Aktion take). Weitere Aktionen gibt es nicht.

Zeichnen Sie den Problemgraphen. Markieren Sie Start- und Zielknoten.
Finden Sie den Weg mit Tiefensuche und mit Breitensuche (Tree-Search). Welche Unterschiede stellen Sie fest?
Welche Wege würden mit der jeweiligen Graph-Search-Variante nicht weiter untersucht?
Suchen Sie nun einen Weg mit A* (Tree-Search). Definieren Sie zunächst Restkostenschätzungen. Was müssen Sie dabei beachten?

Übungsblätter/Aufgaben

Übungsblatt: Problemlösen, Suche

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
A*: Abschnitt 3.5.2, Heuristiken: Kapitel 3.6

Lokale Suche: Gradientensuche

TL;DR

Lokale Suchverfahren: Nur das Ergebnis zählt! Nicht der Weg ist das Ziel, sondern nur das Erreichen des Ziels.

In Analogie zum Bergsteigen: Gehe in Richtung des stärksten Anstiegs kann man die Suche so formulieren, dass man in jedem Suchschritt den Nachfolgeknoten nach dem stärksten Anstieg der Kostenfunktion auswählen. Dieses Verfahren nennt sich auch Hill-Climbing (bzw. Gradientensuche).

Videos (YouTube)

VL Gradientensuche

Videos (HSBI-Medienportal)

VL Gradientensuche

Lernziele

(K2) Problematik der lokalen Minima bei Gradientenverfahren
(K3) Lokale Suche (Gradientenabstieg)

Unterschiede in den Suchproblemen?

Bisher betrachtete Suchverfahren:

Systematische Erkundung des Suchraums
Weg zur Lösung wichtig

=> Oft aber nur das Ziel an sich interessant! (Und nicht, wie man dort hin gelangt.)

Beispiel: Stundenplan

Analogie: Bergsteigen ohne Karte und Pfade

Gradienten-Suche: "Gehe in Richtung des steilsten Anstiegs der Zielfunktion."

=> Schrittweise Verbesserung des aktuellen Zustands (Lokale Suche)

Verschiedene Namen: "Hill-climbing", "Greedy local search"
Kann auch als Minimierung angewendet werden

Pseudoalgorithmus Gradientensuche

"Wie Bergsteigen am Mount Everest in dickem Nebel mit Gedächtnisverlust"

Setze currNode auf den Startknoten
currNode ist gesuchtes Element: Abbruch, melde "gefunden"
- Expandiere alle Nachfolger von currNode
- Setze nextNode auf Nachfolger mit höchster Bewertung
- Falls Bewertung von nextNode $\leq$ Bewertung von currNode: Abbruch, melde "nicht gefunden"
- Setze currNode auf nextNode
Gehe zu Schritt 2

Beispiel Gradientensuche: $n$-Damen

Ziel: Setze $n$ Damen auf ein $n \times n$-Spielfeld ohne Konflikte
Start: Setze $n$ Damen auf ein $n \times n$-Spielfeld (mit Konflikten)
Suche: Bewege jeweils eine Dame so, daß die Anzahl der Konflikte reduziert wird

Schauen Sie sich auch Abb. 4.3 auf Seite 130 im [Russell2020] an!

Hinweis: Alle Damen stehen von Anfang an auf dem Brett und werden nur verschoben => "vollständige Zustandsformulierung"

Eigenschaften 8-Damen-Problem ($n=8$)

Zustandsraum: $8^8 \approx 17$ Millionen Zustände!
Beginnend mit zufällig erzeugtem Startzustand:
- bleibt in 86% der Fälle stecken, d.h.
- findet Lösung nur in 14% der Fälle.
Beobachtung: Lösung nach durchschnittlich 4 Schritten, oder Verfahren bleibt nach durchschnittlich 3 Schritten stecken.

Quelle: nach [Russell2020, p. 131]

Eigenschaften Gradientensuche

Vollständigkeit: nein
Optimalität: nein
Komplexität: linear in der Anzahl der zu expandierenden Knoten

Zielfunktion (Bewertung) nötig!

Problem: lokale Maxima und Plateaus

Lokale Maxima/Minima: Algorithmus findet nur eine suboptimale Lösung
Plateaus: Hier muss der Algorithmus mit zufälligen Zügen explorieren

Wrap-Up

Lokale Suchverfahren: Nur das Ergebnis zählt!

Gradientenverfahren: Gehe in Richtung des stärksten Anstiegs der Kostenfunktion

Quizzes

Selbsttest Gradientensuche (ILIAS)

Challenges

Betrachten Sie folgende Landkarte und Restwegschätzungen:

Quelle: MapGermanyGraph.svg by Regnaron and Jahobr on Wikimedia Commons (Public Domain)

Finden Sie mit der Gradienten-Suche jeweils einen Weg von Würzburg nach München. Vergleichen Sie das Ergebnis mit der Best-First-Suche.

Übungsblätter/Aufgaben

Übungsblatt: Lokale Suche, GA

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Gradientenabstieg: Abschnitt 4.1.1

Lokale Suche: Simulated Annealing

TL;DR

Lokale Suchverfahren: Nur das Ergebnis zählt! Nicht der Weg ist das Ziel, sondern nur das Erreichen des Ziels.

Das Problem bei der Gradientensuche ist, dass man eine Kostenfunktion benötigt und diese auch lokale Minima enthalten kann. Mit der reinen Gradientensuche würde man bei Erreichen lokaler Minima die Suche abbrechen (müssen), da es keine weitere Verbesserung unter den Nachfolgern mehr geben kann. In Anlehnung an das Abkühlen von Metall kann hier eine Variante der lokalen Suche helfen: Simulated Annealing. Man führt einen "Temperatur"-Parameter ein, der im Laufe der Suche immer kleiner wird und schließlich gegen Null geht. In Abhängigkeit von dieser "Temperatur" wird mit einer bestimmten Wahrscheinlichkeit eine Verschlechterung akzeptiert: Bei einer hohen Temperatur ist diese Wahrscheinlichkeit höher, bei einer niedrigen Temperatur niedriger, so dass das Verfahren in ein normales Hill-Climbing übergeht. Damit kann man ein Festfressen in lokalen Minima vermeiden bzw. überwinden.

Videos (YouTube)

VL Simulated Annealing

Videos (HSBI-Medienportal)

VL Simulated Annealing

Lernziele

(K2) Funktionsweise Simulated Annealing

Motivation

Problem: lokale Maxima und Plateaus

Lokale Maxima/Minima: Algorithmus findet nur eine suboptimale Lösung
Plateaus: Hier muss der Algorithmus mit zufälligen Zügen explorieren

Mögliche Lösungen:

Neustart des Algorithmus, wenn kein Fortschritt erzielt wird
Rauschen "injizieren"

Gedankenexperiment: Ausweg aus lokalen Minima

"Drehen der Landschaft": Minimieren statt Maximieren
Ball wird in Zustandsraum-Landschaft gesetzt.
Folge:
- rollt steilsten Abstieg hinunter
- rollt evtl. in Tal auf halber Höhe (lokales Minimum) => bleibt dort gefangen

=> "Schütteln der Landschaft" -- Ball springt aus dem Tal und rollt in anderes Tal

Nicht zu stark schütteln -- sonst wird u.U. globales Minimum verlassen!

Analogie Härten von Metall

Metall erhitzen bis Atome frei beweglich
Langsam abkühlen

=> stabiles Atomgitter mit minimalem Energiezustand

Übertragen der Idee

Starkes "Schütteln" (hohe "Temperatur") am Anfang
Schrittweises "Abkühlen" => "Schütteln" im Laufe der Zeit verringern

=> Simulated Annealing

Pseudocode Simulated Annealing (Minimierungsproblem)

def simulated_annealing(problem):
    current = problem.startNode
    t = 0;  temp = schedule(t)

    while temp>0:
        temp = schedule(++t)
        neighbors = current.expandSuccessors()
        if not neighbors: return current
        working = random.choice(neighbors)
        dE = problem.value(current) - problem.value(working)
        if dE > 0 or probability(math.exp(dE/temp)):
            current = working

    return current

Wenn dE positiv ist, dann ist der Nachfolger "besser" (hier: kleiner bewertet) als der aktuelle Knoten und wird immer als nächster Knoten übernommen.

Wenn dE negativ ist, dann ist der betrachtete Nachfolger "schlechter" (hier: größer bewertet) als der aktuelle Knoten. Dann wird er mit einer Wahrscheinlichkeit math.exp(dE/temp) als nächster Knoten übernommen. Diese Wahrscheinlichkeit ist bei hohen Temperaturen temp eher hoch, und sinkt, je niedriger die Temperatur temp wird.

Die Temperatur temp bewegt sich dabei von hohen positiven Werten auf den Wert Null (wird also nicht negativ).

Detail: Akzeptieren von Verschlechterungen

Quelle: "Exp e.svg" by Marcel Marnitz, reworked by Georg-Johann on Wikimedia Commons (Public Domain)

Wahrscheinlichkeit zum Akzeptieren einer Verschlechterung: math.exp(dE/temp)
$dE$ negativ => $\exp\left(\text{dE}/\text{temp}\right) = \exp\left(-\frac{|\text{dE}|}{\text{temp}}\right) = \frac{1}{\exp\left(\frac{|\text{dE}|}{\text{temp}}\right)}$

$\exp(a)$ bzw. $e^a$:

$a<0$: geht gegen 0
$a=0$: 1
$a>0$: steil (exponentiell) gegen Unendlich ...

Wenn $dE$ negativ ist, wird math.exp(dE/temp) ausgewertet. Damit ergibt sich wegen $dE$ negativ: $\exp\left(\text{dE}/\text{temp}\right) = \exp\left(-\frac{|\text{dE}|}{\text{temp}}\right) = \frac{1}{\exp\left(\frac{|\text{dE}|}{\text{temp}}\right)}$. Betrachtung für $dE$ (nur negativer Fall!) und $\text{temp}$:

Temperatur $\text{temp}$ hoch: $a = \frac{|\text{dE}|}{\text{temp}}$ ist positiv und klein (nahe Null), d.h. $\exp(a)$ nahe 1 (oder größer), d.h. die Wahrscheinlichkeit $1/\exp(a)$ ist nahe 1 (oder kleiner)
Temperatur $\text{temp}$ wird kleiner und geht gegen Null: $a = \frac{|\text{dE}|}{\text{temp}}$ ist positiv und wird größer, d.h. $\exp(a)$ geht schnell gegen Unendlich, d.h. die Wahrscheinlichkeit $1/\exp(a)$ geht gegen 0

Abkühlungsplan problemabhängig wählen

Initiale Temperatur: So hoch, daß praktisch jede Änderung akzeptiert wird
Abkühlen: $T_k = \alpha T_{k-1}$ mit $0.8 \le \alpha \le 0.99$
- Ausreichend langsam abkühlen!
- Typisch: jede Stufe so lange halten, daß etwa 10 Änderungen akzeptiert wurden
Stop: Keine Verbesserungen in 3 aufeinander folgenden Temperaturen

Der Abkühlungsplan muss problemabhängig gewählt werden. Das Beispiel zeigt typische Elementes eines solchen Abkühlungsplans.

Eigenschaften Simulated Annealing

Vollständigkeit: ja (mit gewisser Wahrscheinlichkeit)
Optimalität: ja (mit gewisser Wahrscheinlichkeit)

Voraussetzung: geeigneter Abkühlungsplan

Anwendungen von Simulated Annealing

Flugplan-Scheduling
Layout-Probleme (Chipentwurf, Leiterplatten)
Produktionsplanung

Wrap-Up

Lokale Suchverfahren: Nur das Ergebnis zählt!

Gradientenverfahren
- Analogie Bergsteigen: Gehe in Richtung des stärksten Anstiegs der Kostenfunktion => Hill-Climbing
- Achtung: Probleme mit lokalen Minima => Simulated Annealing

Quizzes

Selbsttest Simulated Annealing (ILIAS)

Übungsblätter/Aufgaben

Übungsblatt: Lokale Suche, GA

Quellen

[Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Simulated Annealing: Abschnitt 4.1.2

Suche

Subsections of Suche

Suche mit Tiefensuche

Hole das Buch

Problemgraph zum Kopiererbeispiel

Anmerkungen Wegesuche (Landkarte)

Tiefensuche (TS, DFS)

Bemerkungen

Konventionen für diese Lehrveranstaltung

Weitere Hinweise

Tiefensuche (rekursive Variante)

Bemerkungen

Eigenschaften der Tiefensuche

Wrap-Up

Suche mit Breitensuche

Hole das Buch

Breitensuche (BS, BFS)

Bemerkungen

Konventionen für diese Lehrveranstaltung

Weitere Hinweise

Eigenschaften Breitensuche vs. Tiefensuche

Praxisvergleich Breitensuche vs. Tiefensuche

Wrap-Up

Suche mit Branch-and-Bound

Hole das Buch

Branch-and-Bound (BnB)

BnB: Finde einen Weg von A nach H

Bemerkungen zu BnB mit Graph-Search

Konventionen für diese Lehrveranstaltung

Eigenschaften von BnB

Wrap-Up

Suche mit Best First

Hole das Buch

Best-First (BF, BFS)

Konventionen BF

Eigenschaften von BF

Wrap-Up

Suche mit A*

Hole das Buch

A*-Suche

Konventionen für diese Lehrveranstaltung

A*-Suche -- Anforderungen an Heuristik (Tree-Search)

A* ist optimal

Einfache Verbesserungen A* (Tree-Search)

A*-Suche -- Anforderungen an Heuristik (Graph-Search)

Eigenschaften Branch-and-Bound, Best-First, A*

Wrap-Up

Lokale Suche: Gradientensuche

Unterschiede in den Suchproblemen?

Analogie: Bergsteigen ohne Karte und Pfade

Pseudoalgorithmus Gradientensuche

Beispiel Gradientensuche: $n$-Damen

Eigenschaften 8-Damen-Problem ($n=8$)

Eigenschaften Gradientensuche

Wrap-Up

Lokale Suche: Simulated Annealing

Motivation

Gedankenexperiment: Ausweg aus lokalen Minima

Analogie Härten von Metall

Übertragen der Idee

Pseudocode Simulated Annealing (Minimierungsproblem)

Detail: Akzeptieren von Verschlechterungen

Abkühlungsplan problemabhängig wählen

Eigenschaften Simulated Annealing

Anwendungen von Simulated Annealing

Wrap-Up