Zum Hauptinhalt springen
Das Training für die Feldextraktion kann für strukturierte und semistrukturierte Dokumente verwendet werden. Das Training ist für einfache Felder, Feldgruppen und wiederkehrende Gruppen verfügbar.
Das Programm sucht nach einem Feld, dessen Umfeld den angegebenen Parametern entspricht.Das Programm kann darauf trainiert werden, Felder auf Grundlage eines einzelnen Dokuments zu extrahieren. Es wird jedoch empfohlen, mindestens 3 Dokumente zu verwenden, um präzisere Ergebnisse zu erzielen.
Das Programm wird darauf trainiert, zu Gruppen zusammengefasste Felder als separate Felder zu extrahieren, ohne die Beziehungen zwischen ihnen zu berücksichtigen. Daher werden die Trainingsergebnisse durch das Umfeld der Felder und nicht durch ihre Gruppenzugehörigkeit bestimmt.
Das Programm wird darauf trainiert, wiederkehrende Gruppen zu erkennen, wenn ein Dokument mehrere wiederkehrende, horizontal voneinander trennbare Gruppen enthält, die in Bezug auf ihr Umfeld ähnlich sind. In diesem Fall verarbeitet das Programm jede Gruppe als wiederkehrende Zeile. Es geht außerdem davon aus, dass eine Zeile die Werte First, Last und Any haben kann.Das Programm wird darauf trainiert, für jeden Zeilentyp Felder als Felder einer einfachen Feldgruppe zu extrahieren.
Um bessere Ergebnisse zu erzielen, wird empfohlen, während des Trainings 3 bis 50 Beispieldokumente von jedem Typ hochzuladen.
Verwenden Sie zur Feinabstimmung der Feldextraktion ABBYY FlexiLayout Studio. Die trainierte Document Definition kann nach FlexiLayout Studio exportiert und als Grundlage für ein neues FlexiLayout verwendet werden.

Variable Feldpositionen in Dokumenten desselben Typs

Das Programm kann Felder in Dokumenten erkennen, die zum selben Typ gehören, aber sehr unterschiedlich aussehen, zum Beispiel Rechnungen von verschiedenen Anbietern, Kontoauszüge, Führerscheine aus verschiedenen Bundesstaaten, verschiedene Formulare usw. ABBYY FlexiCapture ermöglicht die Verarbeitung solcher Dokumente mithilfe einer speziellen Funktion namens document variant. Damit können Sie einen Satz von Varianten für Dokumente erstellen, die zum selben Typ gehören, wobei jede Variante einer bestimmten Feldposition entspricht. Das Training von Feldern mit variabler Position umfasst die Erstellung und das Training des Klassifikators, der zwischen Dokumenttypen unterscheidet. Weitere Informationen finden Sie unter Erstellen eines Klassifikators. Sobald die Variante eines Dokuments bestimmt ist, verwendet das Programm den allgemeinen Trainingsmechanismus für die Feldextraktion.