Zum Hauptinhalt springen
Die Vorerkennung ist die erste Stufe bei der Verarbeitung eines teilstrukturierten Dokuments. Im Gegensatz zu Dokumenten mit fester Struktur, die für die computergestützte Verarbeitung konzipiert sind, weisen unstrukturierte Dokumente unterschiedliche Strukturen auf, und die Datenfelder befinden sich an verschiedenen Stellen auf der Seite. Daher wird die Vorerkennung verwendet, um Objekte im Dokument zu erkennen, die auf die Position von Datenfeldern hinweisen können. Die Vorerkennung ist die erste Stufe der Dokumentanalyse. Da die Vorerkennung beträchtliche Zeit in Anspruch nehmen kann, können Sie sie in FlexiLayout Studio einmal unabhängig vom FlexiLayout-Matching ausführen, damit Sie sich ganz auf das Erstellen und Testen Ihres FlexiLayout konzentrieren können. Bevor Sie jedoch mit dem Erstellen Ihres FlexiLayout beginnen, sollten Sie die Qualität der Vorerkennungsergebnisse beurteilen. Die Qualität der Vorerkennung hängt von der Qualität der Testbilder im Batch ab. Die Qualität der Testbilder wiederum hängt von den Scanparametern wie Helligkeit, Kontrast und Auflösung ab. Wenn Sie mit der Qualität der Vorerkennungsergebnisse nicht zufrieden sind, müssen Sie möglicherweise die Scanoptionen ändern und Ihre Testdokumente erneut scannen. Beachten Sie außerdem, dass Sie in FlexiLayout Studio Bilder mit unterschiedlichen Auflösungen hinzufügen können, sodass Sie mit der Vorerkennung und dem FlexiLayout-Matching experimentieren und die optimalen Scanoptionen auswählen können. Die Vorerkennung kann im schnellen oder im vollständigen Modus ausgeführt werden (siehe Vorerkennungsparameter für weitere Informationen). Während ein FlexiLayout entwickelt wird, muss die Vorerkennung nicht perfekt sein. Es gibt immer eine Möglichkeit, praktisch jedes Datenfeld zu finden, selbst wenn mehrere Erkennungsfehler aufgetreten sind. Tatsächlich ist die Geschwindigkeit der Vorerkennung manchmal wichtiger als die Qualität – die Erkennungsqualität kann in einer Datenerfassungsanwendung auch zu einem späteren Zeitpunkt verbessert werden, indem Sie für jedes Feld Datentypen angeben. Während der Vorerkennung analysiert das Programm die Positionen von Bildpunkten verschiedener Farben, erkennt grundlegende Objekte und fügt Textfragmente zu Wörtern und Zeilen zusammen. Das Programm erkennt die folgenden grundlegenden Objekttypen:
  • Text
  • Bild
  • Satzzeichen
  • Invertierter Text
  • Trennzeichen
  • Barcode
  • Häkchen
Sobald die grundlegenden Objekte erkannt wurden, beginnt das Programm mit der Erkennung der Textobjekte. Der erkannte Text kann in den beiden folgenden Formen angezeigt werden:
  • Erkannte Wörter
  • Erkannte Zeilen

Mehr:

Vorerkennungsparameter Vorerkennung ausführen und Ergebnisse anzeigen Bilder analysieren