CAL3
CAL3 ist eine einfache Erweiterung von CAL2 für nicht-disjunkte (überlappende) Klassen. Statt
beim Baumaufbau bei einer Fehlklassifikation sofort zu verzweigen, werden hier zunächst die
im entsprechenden Pfad aufgelaufenen Klassensymbole gezählt. Wenn ausreichend viele davon
gesehen wurden (Schwelle
- (K3) Meta-Algorithmus CAL3 für überlappende Klassen
CAL3: Erweiterung von CAL2 für nicht-disjunkte Klassen
-
Anfangsschritt:
(totales Unwissen) -
-ter Lernschritt: Objekt mit Klasse-
Rückweisung (Endknoten mit
): Ersetze durch Vereinigungsklasse -
Endknoten mit Vereinigungsklasse:
- Zähler für
erhöhen, bzw. mit Anzahl in Vereinigungsklasse einfügen
- Zähler für
Falls nun die Summe aller Klassen am Endknoten größer/gleich
(Statistikschwelle):-
Für genau eine Klasse gilt:
: => Abschluss: Ersetze Vereinigungsklasse durch (für immer!) -
Für alle Klassen gilt:
: => Differenzierung: Ersetze Vereinigungsklasse durch neuen Test: : nächstes Attribut, auf dem aktuellen Pfad noch nicht verwendet Symbol mit Anzahl 1 an Position wenn
-
Beispiel mit CAL3
0 | 0 | A |
0 | 1 | B |
0 | 1 | A |
1 | 0 | B |
1 | 1 | A |
Ergebnis:
Trainingsfehler:
Hinweis: Bei nicht überlappenden Klassen erzeugt CAL3 u.U. andere Bäume als CAL2 ...
CAL3: Abbruchbedingungen und Parameter
-
Parameter:
: Statistikschwelle, problemabhängig wählen :- Klassifikationsfehler kleiner als
- kleiner Fehler => großer Baum
- großer Fehler => kleiner Baum
-
Abbruch:
- Alle Trainingsobjekte richtig klassifiziert => Kein Fehler in einem kompletten Durchlauf
- Alle Endknoten mit eindeutigen Klassensymbolen belegt
- Differenzierung nötig, aber alle Merkmale verbraucht
- Lernschrittzahl überschritten
Wrap-Up
- CAL3: Erweiterung von CAL2 für überlappende Klassen
- Parameter
(Anzahl Objekte bis Entscheidung), (Dominanz?) - Trainingsfehler wg. überlappender Klassen!
- Parameter
Textklassifikation
Betrachten Sie die folgenden Aussagen:
- Patient A hat weder Husten noch Fieber und ist gesund.
- Patient B hat Husten, aber kein Fieber und ist gesund.
- Patient C hat keinen Husten, aber Fieber. Er ist krank.
- Patient D hat Husten und kein Fieber und ist krank.
- Patient E hat Husten und Fieber. Er ist krank.
Aufgaben:
- Trainieren Sie auf diesem Datensatz einen Klassifikator mit CAL3 (
). - Ist Patient F krank? Er hat Husten, aber kein Fieber.
- [Unger1981] Lernfähige Klassifizierungssysteme (Classifier Systems Which Are Able to Learn)
Unger, S. und Wysotzki, F., Akademie-Verlag, 1981.
Der Vollständigkeit halber aufgeführt (Werk ist leider vergriffen und wird nicht mehr verlegt)