Identifizierung und Verarbeitung von FlexiLayouts in ABBYY FlexiCapture

Sie können eine unbegrenzte Anzahl fester und flexibler Dokumentdefinitionen in einem FlexiCapture-Batch verarbeiten (eine flexible Dokumentdefinition wird aus einem FlexiLayout erstellt).

Vorerkennungsparameter über Dokumentdefinitionen hinweg abstimmen

Wenn ein Batch mehrere flexible Dokumentdefinitionen enthält, sollten alle FlexiLayouts, die zum Erstellen der flexiblen Dokumentdefinitionen verwendet werden, dieselben Vorerkennungsparameter (d. h. Sprache, Texttyp, Modus) verwenden. In diesem Fall wird die Vorerkennung nur einmal ausgeführt, und die Ergebnisse der Vorerkennung werden für andere Dokumentdefinitionen verwendet. Dadurch wird die Verarbeitungszeit verkürzt, da die Vorerkennung in der Regel bis zu 90 % der Zeit beansprucht, die für das Abgleichen der Dokumentdefinition erforderlich ist. FlexiCapture führt die Vorerkennung auf einer Seite für jeden Satz von Vorerkennungsparametern aus, der in den flexiblen Dokumentdefinitionen im Batch angegeben ist. Wenn alle Dokumentdefinitionen dieselbe Vorerkennungssprache haben, wird die Vorerkennung nur einmal ausgeführt, die erkannten Objekte werden gespeichert und für die anderen Dokumentdefinitionen im Batch verwendet. Wenn eine der Dokumentdefinitionen eine andere Vorerkennungssprache (oder einen anderen Texttyp oder Modus) hat, muss FlexiCapture die Seite zweimal vorerkennen, was die für das Abgleichen der Dokumentdefinition erforderliche Zeit verdoppelt. Aus diesem Grund sollten Sie die Anzahl der Parametersätze für die Vorerkennung auf ein Minimum beschränken.

Vorerkennung überspringen

In einigen Fällen können Sie den Abgleich des FlexiLayouts beschleunigen, indem Sie die Vorerkennung überspringen. Das Überspringen ist möglich, wenn die FlexiLayout-Elemente nur Separator-, Barcode-, White Gap-, Region- und Object Collection-Elemente enthalten und alle White Gap- und Object Collection-Elemente eine der folgenden Anforderungen erfüllen:

In den Suchbedingungen des Elements ist kein Text angegeben.
Die UseRawText-Eigenschaft des Elements ist true.

Reihenfolge des Abgleichens für feste und flexible Dokumentdefinitionen

Wenn feste und semistrukturierte Dokumente in einem Batch verarbeitet werden, versucht FlexiCapture zunächst, die festen Dokumentdefinitionen abzugleichen. Wenn die festen Dokumentdefinitionen erfolgreich mit ihren Dokumenten abgeglichen werden, werden keine FlexiLayouts angewendet. Wenn es keine passenden festen Dokumentdefinitionen gibt, sucht FlexiCapture unter den FlexiLayouts nach geeigneten Übereinstimmungen.

Klassifikatoren für die automatische FlexiLayout-Auswahl

Klassifikatoren automatisieren die Auswahl eines FlexiLayouts oder einer Layout-Alternative. Ein Klassifikator ist ein spezielles Projekt, das in FlexiLayout Studio erstellt und in FlexiCapture importiert wird. Das Projekt beschreibt die baumartige Struktur der Klassen, denen ein Dokument angehören kann, und jede Klasse enthält eine Menge von Elementen, die einen bestimmten Dokumenttyp identifizieren. Bei der Klassifizierung werden die Namen der zu verwendenden FlexiLayouts (oder Layout-Alternativen) in den Eigenschaften jeder klassifizierten Seite gespeichert. Weitere Informationen finden Sie unter Klassifizierungsprojekte.

Wählen Sie ein FlexiLayout aus, ohne einen Klassifikator zu verwenden

Wenn keine Klassifikatoren verwendet werden, werden im FlexiLayout Bezeichnerelemente erstellt, damit FlexiCapture das passende FlexiLayout zuverlässiger und schneller auswählen kann. Praktisch jeder Elementtyp kann als Bezeichner verwendet werden. Die einzige Voraussetzung ist, dass er auf allen Dokumenten des betreffenden Typs zuverlässig erkannt wird. Am häufigsten werden Static Text-, Barcode- und Zeichenkette-Elemente als Bezeichner verwendet; manchmal werden auch mehrere Elemente verwendet, um einen Dokumenttyp zu identifizieren. Je weiter oben sich das Bezeichnerelement im FlexiLayout-Baum befindet, desto schneller erfolgt die Auswahl der Dokumentdefinition. Sie können einen Dokumenttyp auf eine der folgenden Arten identifizieren:

Deaktivieren Sie die Eigenschaft Optional element, damit das dem Element entsprechende Objekt auf allen Bildern vorhanden sein muss. Wenn das durch das Element beschriebene Objekt nicht erkannt wird, wird die Dokumentdefinition nicht mit dem Bild abgeglichen.
Verwenden Sie die Funktion DontFind() im Feld Advanced pre-search relations, um die Suche nach einem optionalen Element zu deaktivieren.
Verwenden Sie die Eigenschaft Quality der Elementhypothese. Wenn Sie Quality eines beliebigen Elements im Feld Erweiterte Nach-Suchbeziehungen auf 0 setzen (der entsprechende Code lautet Quality: 0;), schlägt der Abgleich mit der Dokumentdefinition fehl. Bevor Sie die Qualität eines Elements auf 0 setzen, analysieren Sie die Eigenschaften der Elemente, die sich im FlexiLayout-Baum oberhalb des aktuellen Elements befinden.

Speichern von Klassifizierungsstatistiken

Zurück

FlexiLayout-Sprache

Weiter

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Identifizierung und Verarbeitung von FlexiLayouts in ABBYY FlexiCapture

Vorerkennungsparameter über Dokumentdefinitionen hinweg abstimmen

Vorerkennung überspringen

Reihenfolge des Abgleichens für feste und flexible Dokumentdefinitionen

Klassifikatoren für die automatische FlexiLayout-Auswahl

Wählen Sie ein FlexiLayout aus, ohne einen Klassifikator zu verwenden

​Vorerkennungsparameter über Dokumentdefinitionen hinweg abstimmen

​Vorerkennung überspringen

​Reihenfolge des Abgleichens für feste und flexible Dokumentdefinitionen

​Klassifikatoren für die automatische FlexiLayout-Auswahl

​Wählen Sie ein FlexiLayout aus, ohne einen Klassifikator zu verwenden

Vorerkennungsparameter über Dokumentdefinitionen hinweg abstimmen

Vorerkennung überspringen

Reihenfolge des Abgleichens für feste und flexible Dokumentdefinitionen

Klassifikatoren für die automatische FlexiLayout-Auswahl

Wählen Sie ein FlexiLayout aus, ohne einen Klassifikator zu verwenden