Zum Hauptinhalt springen
Die Qualität der Datenerfassung kann durch das Training von FCFORINVOICES verbessert werden. Benutzer können das Programm entweder vor oder während der Dokumentverarbeitung trainieren. Training ist nur für die folgenden Arten von Bildern und in den folgenden Fällen verfügbar:
  • Bilder, auf denen Felder von der vorkonfigurierten Dokumentdefinition nicht zuverlässig erkannt werden können.
  • Der Benutzer muss Daten aus Feldern extrahieren, die in den Standard-Dokumentdefinitionen nicht definiert sind.
  • Die Feldposition variiert zwischen Dokumenten desselben Typs In einem Strom von Dokumenten desselben Typs können vereinzelt ungewöhnliche Dokumente auftreten, bei denen sich die Feldpositionen von denen im Standarddokument unterscheiden. Wenn FCFORINVOICES Felder in solchen Dokumenten nicht zuverlässig erkennen kann, kann der Benutzer die korrekten Feldpositionen angeben, und das Programm wird „lernen“, wie diese Felder erkannt werden. Hinweis: Das genaue Dokumentlayout hängt vom ausstellenden Unternehmen ab. Daher werden Dokumente verschiedener Unternehmen als unterschiedliche Varianten behandelt, und FCFORINVOICES trainiert für jede Dokumentvariante separat.
  • Der Benutzer muss Felder extrahieren, die standardmäßig nicht definiert sind Zusätzlich zu den standardmäßig unterstützten Haupt- und Zusatzfeldern muss der Benutzer möglicherweise Daten aus Feldern erfassen, die dem Programm noch nicht bekannt sind. Dies kann erreicht werden, indem benutzerdefinierte Felder in der Dokumentdefinition erstellt und ihre Positionen auf den Dokumentbildern angegeben werden.
Während der normalen Dokumentverarbeitung oder in einem speziellen Trainingsmodus fügt der Benutzer Dokumentbilder hinzu, die zum Trainieren des Programms verwendet werden sollen. Die hinzugefügten Dokumente werden automatisch erkannt und zur Verifizierung übermittelt. Der Benutzer verifiziert die Dokumente und korrigiert bei Bedarf die Feldpositionen, wodurch ein Referenzlayout erstellt wird.Als Nächstes wird das trainierte Dokument in den für die angegebene Dokumentvariante erstellten Trainings-Batch eingefügt. Der Administrator kann die Liste aller Dokumentvarianten und ihrer Trainings-Batches anzeigen, indem er auf Open Field Extraction Training Batches klickt. Sobald das erste Trainingsdokument für eine Dokumentvariante hinzugefügt wird, beginnt das Programm, Dokumente im entsprechenden Trainings-Batch zu sammeln.Um den Trainingsprozess zu starten, muss ein Trainings-Batch mindestens ein Dokument enthalten. Wenn Clustering verwendet wird, wird für jeden Cluster ein separates FlexiLayout erstellt; andernfalls wird für jedes Unternehmen ein FlexiLayout erstellt (weitere Informationen finden Sie unter Training mit Clustering).Beim Training wird eine FlexiLayout-Variante erstellt, die für alle Dokumente verwendet wird, die zu der angegebenen Dokumentvariante gehören (z. B. für Rechnungen eines bestimmten Vendor oder für Bestellungen eines bestimmten Kunden).Sobald das Training abgeschlossen ist, testet das Programm die FlexiLayout-Variante automatisch an allen Beispieldokumenten.Die Qualität der neuen FlexiLayout-Variante wird bestimmt, indem die Erkennungsergebnisse mit dem vom Benutzer angegebenen Referenzlayout verglichen werden (auf dieselbe Weise bestimmt das Programm die Qualität des Haupt-FlexiLayout, das verwendet wird, wenn kein Training durchgeführt wurde). Anschließend wird die Qualität der FlexiLayout-Variante mit der Qualität der vorherigen FlexiLayout-Variante oder mit der Qualität des Haupt-FlexiLayout verglichen:
  • Wenn die Qualität der neuen FlexiLayout-Variante schlechter ist als die Qualität der alten FlexiLayout-Variante oder des Haupt-FlexiLayout, wird die neue FlexiLayout-Variante nicht gespeichert, und der Benutzer sieht eine entsprechende Meldung im Fenster Train Dokumentdefinition.
  • Wenn die Qualität der neuen FlexiLayout-Variante besser ist als die Qualität der alten FlexiLayout-Variante oder des Haupt-FlexiLayout, wird sie gespeichert und zur Verarbeitung dieser Dokumentvariante verwendet.
FCFORINVOICES kann entweder vom Administrator oder von Operatoren mit ausreichenden Berechtigungen trainiert werden. Um das Programm zu trainieren, muss der Benutzer Dokumentbilder zum Arbeits-Batch hinzufügen, die dann automatisch erkannt und zur Verifizierung übermittelt werden. Sobald der Benutzer die Ergebnisse verifiziert und bei Bedarf die Feldpositionen korrigiert, werden die Dokumente zu dem Trainings-Batch hinzugefügt, das für die angegebene Dokumentvariante verwendet wird. Wenn das Programm über eine ausreichende Anzahl von Dokumenten für die Dokumentvariante verfügt, beginnt das Training automatisch. Das Programm verwendet das durch das Training erworbene Wissen, um alle zukünftigen Dokumente zu erkennen, die zu dieser Dokumentvariante gehören. Wenn es einem Operator nicht gelingt, durch Training einen ausreichenden Grad an Genauigkeit zu erreichen, kann der Administrator Open Field Extraction Training Batches öffnen und das Training des Programms selbst fortsetzen. Der Administrator kann außerdem:”
  • Dokumentbilder hinzufügen oder entfernen, die für das Training verwendet werden.
  • Neue Trainings-Batches erstellen.
  • Dokumentbilder hinzufügen, die nicht für das Training verwendet werden, aber beim Testen der trainierten FlexiLayout-Variante verwendet werden.
  • Die trainierte FlexiLayout-Variante nach ABBYY FlexiLayout Studio exportieren oder ein anderes FlexiLayout aus ABBYY FlexiLayout Studio importieren.
Sobald der gewünschte Genauigkeitsgrad erreicht ist, kann der Administrator das Training durch Operatoren für die angegebene Dokumentvariante untersagen.

Siehe auch:

Training während der Dokumentverarbeitung Training in der Ansicht „Dokumentvarianten“