- Wählen Sie im Hauptmenü Classification Training → View Statistics aus, oder
- Klicken Sie in der Symbolleiste auf die Schaltfläche
Statistics.
- F-measure, Recall,undPrecision – Je höher diese Werte sind, desto genauer sind die Klassifizierungsergebnisse. (Weitere Informationen zur Berechnung von F-measure finden Sie unter Glossary, Classifier F-measure).
- Die Anzahl der Seiten mit Referenzklassen
- Ergebnisse der Seitenklassifizierung:
- True Positive – Die Anzahl der Seiten, denen die Referenzklasse zugewiesen wurde.
- False Positive – Die Anzahl der Seiten, denen eine andere Klasse als die Referenzklasse zugewiesen wurde.
- False Negative – Die Anzahl der Seiten mit einer Referenzklasse, denen keine Klasse zugewiesen wurde.
- True Negative – Die Anzahl der Seiten ohne Referenzklasse, denen keine Klasse zugewiesen wurde.
- Konfusionsmatrix. Die Konfusionsmatrix ist eine visuelle Darstellung der Dokumente, die von einem Klassifizierer am häufigsten verwechselt werden. Die Werte in den Matrixzellen stellen die Verhältnisse von Referenzklassen zu Ergebnisklassen dar. Grüne Zellen zeigen die Anzahl der Seiten, denen eine Klasse korrekt zugewiesen wurde. Rote Zellen zeigen die Anzahl der Seiten mit verwechselten Klassen – also Klassen, die Seiten mit einer Referenzklasse vom Klassifizierer fälschlicherweise zugewiesen wurden.
Werkzeuge für die Arbeit mit der Konfusionsmatrix
Werkzeuge für die Arbeit mit der Konfusionsmatrix
- Die Option Confused only blendet Klassen aus, bei denen die Ergebnisklassen für alle Seiten ihrer Referenzklasse entsprachen.
- Mit den Schaltflächen Pages und Percent kann der Benutzer zwischen absoluten Zahlen und Prozentangaben zur Anzahl der Seiten mit korrekt identifizierten und verwechselten Klassen wechseln (der Prozentsatz wird anhand des Verhältnisses der Seiten mit einer korrekt zugewiesenen Klasse zu allen Seiten mit derselben Referenzklasse berechnet).
- Der Maßstab der Matrix kann wie folgt angepasst werden:
- zeigt die Matrix mit einem festen Maßstab an;
- zeigt die gesamte Matrix an;
- vergrößern;
- verkleinern.
Konfusionsmatrix anzeigen
Konfusionsmatrix anzeigen

- Statistiken nach Klasse. Eine Tabelle mit Statistiken für Seiten, bei denen die Ergebnisklasse nicht mit der Referenzklasse übereinstimmt. So kann der Benutzer die Klassen identifizieren, die bei einem bestimmten Klassifizierer die meisten Fehler verursachen. Sie können nach der Anzahl verwechselter Seiten sowie nach dem Verhältnis verwechselter Seiten zur Gesamtzahl der Seiten dieser Referenzklasse sortieren.
- Verwechselte Klassen. Diese Registerkarte enthält eine Liste aller Klassen, die von einem Klassifizierer falsch zugewiesen wurden. Anhand dieser Daten können Sie feststellen, welche Klassen am häufigsten miteinander verwechselt werden.
- Zusammenfassende Statistiken zu den wichtigsten Klassifizierungsparametern: F-measure, Recall, Precision sowie nach Seiten aufgeschlüsselte Klassifizierungsergebnisse.
- Nach Klassen aufgeschlüsselte wichtigste Klassifizierungsparameter.
- Verwechselte Klassen – Anzahl und Prozentsatz der Seiten für jede verwechselte Klasse.
- Alle Klassen – Anzahl und Prozentsatz der Seiten für jede Klasse.
- Dokumente mit dem Status For Training wurden hinzugefügt/entfernt;
- Der Status For Training wurde einem Dokument zugewiesen oder einem Dokument entzogen;
- Klassen wurden hinzugefügt, gelöscht oder zusammengeführt;
- Einem Dokument wurde eine andere Referenzklasse zugewiesen;
- Ein Klassifizierungsprofil und/oder die Precision-Recall-Priorität wurden geändert.
