Zum Hauptinhalt springen
Fehler bei der Klassifizierung eines Dokuments durch einen Klassifikator lassen sich in zwei Kategorien einteilen:
  1. Der Klassifikator weist dem Dokument die falsche Klasse zu, z. B. wird eine Seite vom Typ A als Typ B klassifiziert.
  2. Der Klassifikator weist dem Dokument überhaupt keine Klasse zu.
Anhand von zwei Parametern, die aus diesen Kategorien abgeleitet werden, lässt sich die Qualität der Klassifizierung beschreiben:
  • Precision ist das Verhältnis der Dokumente, denen eine bestimmte Klasse korrekt zugewiesen wurde, zu allen Dokumenten, denen diese Klasse zugewiesen wurde (d. h. die Summe der Dokumente, denen diese Klasse korrekt zugewiesen wurde, und der Dokumente, denen diese Klasse irrtümlich zugewiesen wurde).
  • Recall ist das Verhältnis der Dokumente, denen eine Klasse korrekt zugewiesen wurde, zu allen Dokumenten dieser Klasse.

Sie können die Klassifizierungseinstellungen so anpassen, dass Recall oder Precision Vorrang haben.

Precision priorisieren

Wenn Sie möchten, dass möglichst wenige Dokumente der falschen Klasse zugeordnet werden, auch wenn dadurch einige Dokumente gar keiner Klasse zugewiesen werden, verwenden Sie die Einstellung Hohe Precision. Beispiel Ein Unternehmen muss Rechnungen und Verträge klassifizieren, damit sie an die Abteilungen weitergeleitet werden können, die für die Bearbeitung der jeweiligen Dokumentart zuständig sind. Wenn FlexiCapture eine Rechnung falsch klassifiziert, wird sie nicht an die richtige Abteilung weitergeleitet und nicht bezahlt. Wenn FlexiCapture die Rechnung gar nicht klassifiziert, kann sie manuell klassifiziert und an die richtige Abteilung weitergeleitet werden. In diesem Fall ist es wichtiger, Fehlklassifizierungen zu vermeiden, als möglichst viele Dokumente zu klassifizieren.

Recall priorisieren

Wenn Sie erreichen möchten, dass möglichst wenige Dokumente keiner Klasse zugewiesen werden, auch wenn dadurch einige Dokumente der falschen Klasse zugeordnet werden, verwenden Sie die Einstellung Hoher Recall. Beispiel Ein Unternehmen muss unter zahlreichen anderen Kreditdokumenten die relevanten Dokumente identifizieren, die verarbeitet werden müssen. Wenn FlexiCapture einem relevanten Dokument keine Klasse zuweist, wird es nicht verarbeitet. Die Verarbeitung von Dokumenten, denen die falsche Klasse zugewiesen wurde, kann durch zusätzliche Verarbeitungsschritte vermieden werden, z. B. durch Anwenden eines FlexiLayout, durch die Verwendung von Validierungsregeln und durch manuelle Verarbeitung. In diesem Fall ist es wichtiger, möglichst vielen relevanten Dokumenten eine Klasse zuzuweisen, als möglichst häufig die richtige Klasse zuzuweisen. Standardmäßig ist Klassifizierungspriorität auf ausgewogen festgelegt.