Zum Hauptinhalt springen
Sie können eine unbegrenzte Anzahl „fester“ und „flexibler“ Dokumentdefinitionen in einem FlexiCapture-Batch verarbeiten (eine „flexible“ Dokumentdefinition wird aus einem FlexiLayout erstellt). Wenn ein Batch mehrere flexible Dokumentdefinitionen enthält, empfiehlt es sich, in allen FlexiLayouts, die zum Erstellen der flexiblen Dokumentdefinitionen verwendet werden, dieselben Vorerkennungsparameter (d. h. Sprache, Texttyp, Modus) zu verwenden. In diesem Fall wird die Vorerkennung nur einmal ausgeführt, und die Ergebnisse der Vorerkennung werden für andere Dokumentdefinitionen verwendet. Dadurch wird die Verarbeitungszeit verkürzt, da die Vorerkennung in der Regel bis zu 90 % der Zeit beansprucht, die für das Matching der Dokumentdefinition erforderlich ist. FlexiCapture führt die Vorerkennung auf einer Seite für jeden Satz von Vorerkennungsparametern aus, der in den flexiblen Dokumentdefinitionen im Batch angegeben ist. Wenn alle Dokumentdefinitionen dieselbe Vorerkennungssprache haben, wird die Vorerkennung nur einmal ausgeführt, die erkannten Objekte werden gespeichert und für die anderen Dokumentdefinitionen im Batch verwendet. Wenn eine der Dokumentdefinitionen eine andere Vorerkennungssprache (oder einen anderen Texttyp oder Modus) hat, muss FlexiCapture die Seite zweimal vorerkennen, was die für das Matching der Dokumentdefinition erforderliche Zeit verdoppelt. Aus diesem Grund empfehlen wir, die Anzahl der Parametersätze für die Vorerkennung auf ein Minimum zu beschränken. In einigen Fällen können Sie das Matching von FlexiLayouts beschleunigen, indem Sie die Vorerkennung überspringen. Dies ist möglich, wenn die FlexiLayout-Elemente nur Separator-, Barcode-, White Gap-, Region- und Object Collection-Elemente enthalten und alle White Gap- und Object Collection-Elemente eine der folgenden Anforderungen erfüllen:
  • in den Suchbedingungen des Elements ist kein Text angegeben
  • die Eigenschaft UseRawText des Elements ist true.
Wenn feste und semistrukturierte Dokumente in einem Batch verarbeitet werden, versucht das Programm zunächst, die festen Dokumentdefinitionen zu matchen. Wenn die festen Dokumentdefinitionen erfolgreich mit ihren Dokumenten gematcht werden, werden keine FlexiLayouts angewendet. Wenn es keine passenden festen Dokumentdefinitionen gibt, sucht das Programm nach geeigneten Übereinstimmungen unter den FlexiLayouts.”

Klassifikatoren

Klassifikatoren werden verwendet, um die Auswahl eines FlexiLayouts oder einer Layout-Alternative zu automatisieren. Classifier ist ein spezielles Projekt, das in FlexiLayout Studio erstellt und in FlexiCapture importiert wird. Das Projekt beschreibt die baumartige Struktur der Klassen, denen ein Dokument angehören kann. Jede Klasse enthält eine Menge von Elementen, die einen bestimmten Dokumenttyp identifizieren. Bei der Klassifizierung werden die Namen der zu verwendenden FlexiLayouts (oder Layout-Alternativen) in den Eigenschaften jeder klassifizierten Seite gespeichert. Weitere Informationen zu Klassifikationsprojekten finden Sie unter Classifier-Projekt.

Auswahl eines FlexiLayout ohne Einsatz eines Klassifikators

Wenn keine Klassifikatoren verwendet werden, werden im FlexiLayout Bezeichnerelemente erstellt, um die Auswahl des passenden FlexiLayout durch FlexiCapture zuverlässiger zu machen und den Prozess zu beschleunigen. Praktisch jeder Elementtyp kann als Bezeichner verwendet werden. Die einzige Voraussetzung ist, dass er auf allen Dokumenten des jeweiligen Typs zuverlässig erkannt wird. In der Praxis werden am häufigsten die Elemente Static Text, Barcode und Zeichenkette als Bezeichner verwendet. Manchmal werden auch mehrere Elemente verwendet, um einen Dokumenttyp zu identifizieren. Je höher das Bezeichnerelement im FlexiLayout-Baum steht, desto schneller erfolgt die Auswahl der Dokumentdefinition. Eine Möglichkeit, ein Bezeichnerelement zu erstellen, besteht darin, die Eigenschaft Optional element zu deaktivieren – das dem Element entsprechende Objekt muss auf allen Bildern vorhanden sein. Wenn das durch das Element beschriebene Objekt nicht erkannt wird, wird die Dokumentdefinition nicht mit dem Bild abgeglichen. Zusätzlich können Sie ein Dokument identifizieren, indem Sie die Funktion DontFind() im Feld Advanced pre-search relations verwenden. Dadurch wird das Programm angewiesen, nicht nach einem optionalen Element zu suchen. Eine weitere Methode zur Identifizierung einer flexiblen Dokumentdefinition besteht darin, die Eigenschaft Quality der Elementhypothese zu verwenden. Wird die Quality eines beliebigen Elements im Feld Advanced post-search relations auf 0 gesetzt (der entsprechende Code lautet Quality: 0;), wird die Dokumentdefinition nicht abgeglichen. Bevor Sie die Qualität eines Elements auf 0 setzen, müssen Sie die Eigenschaften der Elemente analysieren, die sich im FlexiLayout-Baum oberhalb des aktuellen Elements befinden.