Zum Hauptinhalt springen
FlexiLayouts und Klassifikatoren bieten zahlreiche benutzerdefinierte Einstellungen, darunter Vorerkennungseinstellungen wie Erkennungssprachen, Texttyp, Vorerkennungsmodi und Bereiche. Durch die Auswahl der richtigen Vorerkennungseinstellungen können Sie FlexiLayouts und Klassifikatoren erstellen, die sich gut für die Verarbeitung Ihrer Dokumente eignen. Sie können die Vorerkennungseinstellungen im Dialogfeld Pre-recognition Properties ändern. So öffnen Sie dieses Dialogfeld:
  • Klicken Sie im Menü FlexiLayout oder Classifier bzw. im Kontextmenü des FlexiLayouts oder Klassifikators auf Properties…
  • Klicken Sie auf der Registerkarte General des Dialogfelds Properties of %Name% auf die Schaltfläche Advanced Pre-recognition Properties…
Das Dialogfeld Pre-recognition Properties wird geöffnet. Die in diesem Dialogfeld verfügbaren Optionen sind nachstehend aufgeführt.

Registerkarte Allgemein

Name

Das Verfahren, mit dem der Text auf den Dokumenten gedruckt wurde:

  • Typografisch,
  • Matrixdrucker,
  • Schreibmaschine.

Bestimmen Sie vor der Auswahl dieser Optionen den Texttyp und bewerten Sie dessen Qualität.

  • Schnellmodus. Farb- und Halbtonbilder werden vor der Erkennung binarisiert (in Schwarz-Weiß umgewandelt). Die schnelle Erkennung benötigt weniger Zeit und liefert in den meisten Fällen zufriedenstellende Ergebnisse.
  • Ausgewogener Modus. Das Programm berücksichtigt zusätzlich die Bildfarben; die Erkennung dauert länger, bietet dafür aber eine bessere Qualität.
    Hinweis. Für die Algorithmen des ausgewogenen Erkennungsmodus sind keine weiteren Änderungen geplant, da bereits die bestmöglichen Werte bei Geschwindigkeit und Qualität erreicht wurden
  • Der Normalmodus ist der Standard. Er wird auch empfohlen, wenn die Vorerkennung im Schnellmodus / ausgewogenen Modus zu mehreren Fehlern führt.
  • Der genaue Modus ist für die Datenextraktion aus schwer lesbaren digitalen Bildern oder aus Dokumenten mit schlechter Qualität vorgesehen
    Hinweis. Der genaue Modus benötigt am meisten Zeit und wird daher nur für problematische Bilder/Dokumente empfohlen.

Textsprachen

Die in den Dokumenten verwendeten Sprachen. Sie können eine oder mehrere Sprachen aus der Dropdown-Liste auswählen. Eine vollständige Liste der verfügbaren Sprachen finden Sie unter Von ABBYY FlexiLayout™ Studio unterstützte OCR-Sprachen.

Mit dieser Optionsgruppe können Sie Benutzerwörterbücher hinzufügen. Benutzerwörterbücher verbessern die Erkennungsqualität, indem sie integrierte Wörterbücher um Fachbegriffe, Abkürzungen, Firmennamen usw. ergänzen.

Diese Gruppe enthält zwei Optionen für die Barcode-Verarbeitung:

  • Barcode-Extraktion deaktivieren – Wählen Sie diese Option, wenn auf Ihren Bildern keine Barcodes gesucht werden sollen. Dadurch wird die Dokumenterkennung erheblich beschleunigt.
  • 2D-Barcodes extrahieren: Data Matrix, Aztec, QR Code – Wählen Sie diese Option, wenn die zu verarbeitenden Bilder Data Matrix-, Aztec- und QR Code-Barcodes enthalten. Wenn diese Option nicht aktiviert ist, werden diese Barcodes vom Programm auf Bildern nicht erkannt und sind in den Eigenschaften des Barcode-Elements nicht verfügbar.
  • Postbarcodes extrahieren - Wählen Sie diese Option, wenn Ihre Bilder Postbarcodes enthalten, z. B. Australia Post. Wenn diese Option nicht ausgewählt ist, werden Postbarcodes auf Bildern nicht erkannt und sind in den Eigenschaften des Barcode-Elements nicht verfügbar.
    Wichtig! Das Extrahieren von Postbarcodes verlangsamt die Erkennung.

CJK

Enthält Optionen zur Verarbeitung von CJK-Sprachen (Chinesisch, Japanisch und Koreanisch).

  • Getrennter Furigana-Modus – Wählen Sie diese Option aus, um die Erkennungsqualität bei der Verarbeitung japanischer Texte mit Furigana (Aussprachehilfen) zu verbessern.

Named Entities extrahieren – Wählen Sie diese Option aus, um mithilfe von NLP-Methoden aussagekräftige Informationen aus einem Feld oder einer Feldgruppe zu extrahieren.

Hinweis. Diese Option ist nur für Lizenzen verfügbar, die ein NLP-Sprachmodul enthalten.

Vertikale Textextraktion

Parameter für die vertikale Textextraktion:

  • Für alle Sprachen extrahieren – Erkennt vertikal gesetzten Text in allen unterstützten Sprachen.
  • Nicht extrahieren – Deaktiviert die Erkennung von vertikal gesetztem Text.
  • Für CJK-Sprachen extrahieren – Erkennt vertikal gesetzten Text auf Chinesisch, Japanisch oder Koreanisch.

Der Bereich, der vorerkannt werden soll. Sie können die Position des Vorerkennungsbereichs relativ zu den Seitenrändern angeben.

Mit dieser Option können Sie ein Benutzermuster im PTN- oder FBT-Format hinzufügen. Wir empfehlen die Verwendung solcher Benutzermuster wenn Ihre Dokumente ungewöhnliche Schriftarten und Zeichen enthalten.