Zum Hauptinhalt springen
Bei der Verarbeitung semi-strukturierter Dokumente in ABBYY FlexiCapture möchte man in der Regel Dokumente ausschließen, die nicht zum aktuellen Typ gehören. Eine Möglichkeit, ein Dokument zu identifizieren, besteht darin, mindestens ein Element als erforderlich zu markieren. In diesem Fall eignet sich die Dokumentüberschrift gut als Bezeichnerelement, da sie eindeutigen Text enthält, der von der OCR-Engine leicht gelesen werden kann.
Ein Bezeichnerelement oder eine Gruppe von Elementen kann in einem vordefinierten Header-Element beschrieben werden (wird in diesem Beispiel nicht verwendet).
Die Dokumentüberschrift wird ausschließlich verwendet, um das Dokument als zum angegebenen Typ gehörig zu identifizieren, und wird in ABBYY FlexiCapture nicht erkannt. Beschreiben Sie die Dokumentüberschrift im FlexiLayout als ein Element vom Typ Static Text:
  1. Klicken Sie im Hauptfenster des Programms auf die Registerkarte FlexiLayout.
  2. Wählen Sie im FlexiLayout-Baum SearchElements aus.
  3. Wählen Sie den Befehl Static Text unter FlexiLayout → Add Elements → Static Text oder im Kontextmenü des Elements.
  4. Geben Sie im Feld Name einen Namen für das Element ein, z. B. FormHeader.
  5. Wählen Sie auf der Registerkarte General Required element, da die Dokumentüberschrift ein erforderliches Element ist.
  1. Klicken Sie auf die Registerkarte Static Text.
  1. Geben Sie im Feld „Search text“ den zu findenden Text ein. Der Batch enthält Testdokumente mit unterschiedlichen Überschriften: Easiest Recipes oder Easy to Cook Recipes. Geben Sie beide Überschriften ein. Die Überschriften stehen in allen Testbildern in einer Zeile. Daher können Sie die Überschriften ohne Leerzeichen eingeben, um die Suche nach einzeiligem statischem Text zu beschleunigen. Trennen Sie die beiden alternativen Überschriften durch „|“.
  2. Legen Sie die maximale Anzahl von Fehlern fest, die der erkannte Text enthalten darf (entweder in Prozent oder als Zahl). In diesem Fall empfehlen wir, Max error percentage auf 20 zu setzen, sodass 5 Fehler bei den 25 Zeichen der Dokumentüberschrift zulässig sind.
Die maximale Anzahl von Fehlern wird durch Ausprobieren ermittelt.