Vorerkennungsparameter

FlexiLayouts und Klassifikatoren bieten zahlreiche benutzerdefinierte Einstellungen, darunter Vorerkennungseinstellungen wie Erkennungssprachen, Texttyp, Vorerkennungsmodi und Bereiche. Durch die Auswahl der richtigen Vorerkennungseinstellungen können Sie FlexiLayouts und Klassifikatoren erstellen, die sich gut für die Verarbeitung Ihrer Dokumente eignen. Sie können die Vorerkennungseinstellungen im Dialogfeld Pre-recognition Properties ändern. Verwenden Sie eine der folgenden Möglichkeiten, um dieses Dialogfeld zu öffnen:

Klicken Sie im Menü FlexiLayout oder Klassifikator bzw. im Kontextmenü des FlexiLayouts oder Klassifikators auf Properties….
Klicken Sie auf der Registerkarte General des Dialogfelds „Eigenschaften“ des FlexiLayouts oder Klassifikators auf die Schaltfläche Advanced Pre-recognition Properties….

Die folgenden Optionen sind im Dialogfeld Pre-recognition Properties verfügbar.”

Registerkarte „Allgemein“

Name – Das Verfahren, mit dem der Text auf den Dokumenten gedruckt wurde. Bestimmen Sie den Texttyp und beurteilen Sie seine Qualität. Wählen Sie anschließend eine der folgenden Optionen aus:

Typografisch
Matrixdrucker
Schreibmaschine

Vorerkennungsmodus – Der Modus, der für die Vorerkennung der Dokumente verwendet wird.

Modus	Beschreibung
Fast	Farb- und Halbtonbilder werden vor der Erkennung binarisiert (in Schwarzweiß umgewandelt). Die schnelle Erkennung benötigt weniger Zeit und liefert in den meisten Fällen zufriedenstellende Ergebnisse.
Balanced	Dabei werden auch die Bildfarben berücksichtigt. Die Erkennung ist deshalb langsamer, liefert aber eine bessere Qualität. An den Algorithmen des Modus Balanced sind keine weiteren Änderungen geplant, da bereits die bestmögliche Geschwindigkeit und Qualität erreicht wurden.
Normal	Der Standardmodus. Er wird auch empfohlen, wenn die Vorerkennung im Modus Fast oder Balanced zu mehreren Fehlern führt.
Accurate	Gedacht für die Datenextraktion aus schwer lesbaren digitalen Bildern oder Dokumenten mit geringer Qualität. Dieser Modus benötigt am meisten Zeit und sollte daher nur für problematische Bilder oder Dokumente verwendet werden.

Sprachen Tab

Textsprachen – Die in den Dokumenten verwendeten Sprachen. Sie können eine oder mehrere Sprachen aus der Dropdown-Liste auswählen. Eine vollständige Liste der verfügbaren Sprachen finden Sie unter Von ABBYY FlexiLayout™ Studio unterstützte OCR-Sprachen. Benutzerwörterbücher – Mit dieser Optionsgruppe können Sie Benutzerwörterbücher hinzufügen. Benutzerwörterbücher verbessern die Erkennungsqualität, indem sie integrierte Wörterbücher um Fachbegriffe, Abkürzungen, Firmennamen usw. ergänzen.

Advanced

Barcodes

Option	Beschreibung
Barcode-Extraktion deaktivieren	Wählen Sie diese Option aus, wenn auf Ihren Bildern keine Barcodes gefunden werden sollen. Dadurch wird die Dokumenterkennung erheblich beschleunigt.
2D-Barcodes extrahieren: Data Matrix, Aztec, QR Code	Wählen Sie diese Option aus, wenn die von Ihnen verarbeiteten Bilder Data Matrix-, Aztec- und QR-Code-Barcodes enthalten. Wenn diese Option nicht aktiviert ist, werden diese Barcodes auf Bildern nicht erkannt und sind in den Eigenschaften des Barcode-Elements nicht verfügbar.
Postbarcodes extrahieren	Wählen Sie diese Option aus, wenn Ihre Bilder Postbarcodes enthalten, zum Beispiel Australia Post. Wenn diese Option nicht ausgewählt ist, werden Postbarcodes auf Bildern nicht erkannt und sind in den Eigenschaften des Barcode-Elements nicht verfügbar. Das Extrahieren von Postbarcodes verlangsamt die Erkennung.

CJK

Enthält Optionen für die Verarbeitung von CJK-Sprachen (Chinesisch, Japanisch und Koreanisch). Getrennter Furigana-Modus – Wählen Sie diese Option, um die Erkennungsqualität bei der Verarbeitung von japanischem Text mit Furigana (Aussprachehilfen) zu verbessern.

NER-Erkennung

Named Entities extrahieren – Wählen Sie diese Option, um mithilfe von NLP-Methoden aussagekräftige Informationen aus einem Feld oder einer Feldgruppe zu extrahieren.

Diese Option ist nur für Lizenzen verfügbar, die ein NLP-Sprachmodul enthalten.

Extraktion von vertikalem Text

Option	Beschreibung
Für alle Sprachen extrahieren	Erkennt vertikal ausgerichteten Text in allen unterstützten Sprachen.
Nicht extrahieren	Verhindert die Erkennung von vertikal ausgerichtetem Text.
Für CJK-Sprachen extrahieren	Erkennt vertikalen Text in Chinesisch, Japanisch oder Koreanisch.

Vorerkennungsbereich

Der Bereich, der vorerkannt werden soll. Sie können die Position des Vorerkennungsbereichs relativ zu den Seitenrändern angeben.

User Pattern

Fügt ein User Pattern im PTN- oder FBT-Format hinzu. Verwenden Sie ein User Pattern, wenn Ihre Dokumente nicht standardmäßige Schriftarten und Zeichen enthalten.

Vorerkennung

Zurück

Vorerkennung ausführen und Ergebnisse anzeigen

Weiter

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Registerkarte „Allgemein“

Sprachen Tab

Advanced

Barcodes

CJK

NER-Erkennung

Extraktion von vertikalem Text

Vorerkennungsbereich

User Pattern

​Registerkarte „Allgemein“

​Sprachen Tab

​Advanced

​Barcodes

​CJK

​NER-Erkennung

​Extraktion von vertikalem Text

​Vorerkennungsbereich

​User Pattern

Registerkarte „Allgemein“

Sprachen Tab

Advanced

Barcodes

CJK

NER-Erkennung

Extraktion von vertikalem Text

Vorerkennungsbereich

User Pattern