Zum Hauptinhalt springen
Fälle, in denen ein Klassifikator ein Dokument nicht korrekt klassifiziert, lassen sich in zwei Kategorien einteilen:
  1. Der Klassifikator weist einem Dokument die falsche Klasse zu, z. B. wird eine Seite der Klasse A als Klasse B klassifiziert.
  2. Der Klassifikator weist einem Dokument überhaupt keine Klasse zu.
Diese beiden Fehlerkategorien kennzeichnen die Qualität der Dokumentklassifizierung und werden üblicherweise als Präzision und Recall gemessen.
  • Präzision wird berechnet, indem die Anzahl der Dokumente, die einer bestimmten Klasse korrekt zugewiesen wurden, durch die Gesamtzahl der Dokumente geteilt wird, die dieser Klasse zugewiesen wurden.
  • Recall wird berechnet, indem die Anzahl der Dokumente, die einer bestimmten Klasse korrekt zugewiesen wurden, durch die Gesamtzahl der Dokumente dieser Klasse geteilt wird.

Sie können die Klassifizierungseinstellungen anpassen, um Recall oder Präzision zu bevorzugen.

Präzision priorisieren

Verwenden Sie die Einstellung Hohe Präzision, wenn die Anzahl der Dokumente, die der falschen Klasse zugewiesen werden, so gering wie möglich sein muss (und wenn es akzeptabel ist, dass einige Dokumente unklassifiziert bleiben). Beispiel Ein Unternehmen muss Rechnungen und Verträge klassifizieren, damit sie an die Abteilungen weitergeleitet werden können, die für die Bearbeitung der jeweiligen Dokumentklasse zuständig sind. Wenn ABBYY FlexiCapture eine Rechnung falsch klassifiziert, gelangt sie nicht in die richtige Abteilung und bleibt unbezahlt. Wenn ABBYY FlexiCapture die Rechnung überhaupt nicht klassifiziert, kann sie manuell klassifiziert und an die richtige Abteilung weitergeleitet werden. In diesem Beispiel ist es wichtig, die Klasse eines Dokuments so präzise wie möglich zu bestimmen.

Recall priorisieren

Verwenden Sie die Einstellung High Recall, wenn die Anzahl der Dokumente, die keiner Klasse zugeordnet werden, so gering wie möglich sein soll (und es akzeptabel ist, dass einige Dokumente der falschen Klasse zugeordnet werden). Beispiel Ein Unternehmen muss in einem Stapel verschiedener anderer Darlehensdokumente eine bestimmte Klasse von Darlehensdokumenten identifizieren und verarbeiten. Wenn ABBYY FlexiCapture einem relevanten Dokument keine Klasse zuweist, wird dieses Dokument nicht verarbeitet. Das Unternehmen kann verhindern, dass Dokumente verarbeitet werden, denen die falsche Klasse zugewiesen wurde, indem es ein FlexiLayout anwendet, Validierungsregeln verwendet oder den Fehler manuell korrigiert. In diesem Beispiel ist es wichtig, möglichst viele relevante Dokumente zu erfassen. Standardmäßig ist Recall and precision balance auf balanced festgelegt.