Zum Hauptinhalt springen
Nach dem Training werden die Klassifikationsergebnisse zur Erstellung eines Statistikberichts verwendet.
  • Wenn die einer Seite zugewiesene Klasse einer Referenzklasse entspricht, gilt dies als True Positive (TP);
  • Wenn einer Seite ohne Referenzklasse keine Klasse zugewiesen wurde, gilt dies als True Negative (TN);
  • Wenn die einer Seite zugewiesene Klasse nicht einer Referenzklasse entspricht, gilt dies als False Positive (FP);
  • Wenn einer Seite mit Referenzklasse keine Klasse zugewiesen wurde, gilt dies als False Negative (FN).
Für jede Klasse wird somit erfasst, wie oft sie:
  • korrekt zugewiesen wurde (TP);
  • korrekterweise nicht zugewiesen wurde (TN);
  • fälschlicherweise zugewiesen wurde (FP);
  • fälschlicherweise nicht zugewiesen wurde (FN).
Um die Statistiken anzuzeigen, wählen Sie Classifier > Show statistics. Je höher Precision, Recall und das F-measure sind, desto besser sind die Klassifikationsergebnisse. (Weitere Details zur Berechnung des F-measure finden Sie im Glossary). Das F-measure ist ein ausgewogenes Maß für Precision und Recall und ermöglicht anhand dieser Parameter eine zusammenfassende Bewertung der Klassifikationsqualität. Weitere Informationen dazu, wie Sie das F-measure verbessern können, finden Sie im Abschnitt Tips for improving classification quality. Zur Qualitätsbewertung stehen außerdem in den folgenden Tabs weitere Statistiken zur Verfügung:
  • Confusion Matrix. Die Konfusionsmatrix veranschaulicht, welche Dokumente von einem Klassifikator am häufigsten verwechselt werden. Die Zellen auf der Diagonalen der Matrix zeigen, wie viele Dokumente korrekt klassifiziert wurden. Die rechte Spalte und die letzte Zeile enthalten Informationen zu Dokumenten, denen keine Klasse zugewiesen wurde. Die übrigen Zellen zeigen die Dokumente, die falsch klassifiziert wurden;
  • Confusing Classes. Dieser Tab enthält eine Liste von Klassen, die vom Klassifikator verwechselt wurden. Diese Statistik kann Ihnen dabei helfen, herauszufinden, welche Klassen am häufigsten miteinander verwechselt werden;
  • Statistics by Class. Hier wird für jede Klasse eine detaillierte Statistik angezeigt, sodass Sie die Klassen identifizieren können, bei denen der Klassifikator die meisten Fehler macht.