Zum Hauptinhalt springen

Grundlegende Funktionen der Dokumentanalyse

Die Dokumentanalyse ist eine Reihe von Funktionen zur automatischen Erkennung der folgenden Objekte auf einer Seite:
  • Textblöcke
  • Bilder
  • Tabellen und Tabellenzellen
  • Barcodes
  • Trennlinien
Darüber hinaus bietet die Dokumentanalyse einige spezielle Funktionen, um Bilder für Optical Character Recognition (OCR) vorzubereiten:
  • Erkennung der Seitenausrichtung — 90, 180 und 270 Grad
  • Doppelseiten aufteilen
  • Erkennung von vertikalem Text in Tabellenzellen
  • Störblöcke auf der Seite erkennen und markieren
Diese Vorbereitung ist von großer Bedeutung, um festzulegen, welche Felder auf der Seite erkannt werden sollen und was in der ursprünglichen Form beibehalten werden soll. Außerdem können Felder auch manuell für die Erkennung ausgewählt werden. In diesem Fall müssen Sie die Koordinaten des Feldes und den darin enthaltenen Datentyp festlegen. Dies wird hauptsächlich im Szenario Erkennung auf Feldebene zur Datenerfassung verwendet. ABBYY FineReader Engine 12 bietet 3 automatische und 1 manuellen Typen der Dokumentanalyse:

Allgemeine Dokumentenanalyse

Dies ist der Standardtyp der Dokumentenanalyse, bei dem nach allen Objekten gesucht wird: Textblöcken, Bildern, Tabellen, Barcodes und Trennzeichen. Die Ergebnisse dieser Analyse werden für die Ermittlung von Dokumentstruktur und Layout im Szenario der Inhaltswiederverwendung verwendet. Alle Bilder und Diagramme bleiben in ihrer ursprünglichen Form erhalten, ohne dass der darauf enthaltene Text erkannt wird.

Dokumentanalyse für Rechnungen

Dies ist ein Vorverarbeitungsmodul zur Konvertierung teilstrukturierter Dokumente wie Rechnungen, Zahlungsentwürfe, Abrechnungen, Frachtbriefe, Visitenkarten, Vereinbarungen, Krankenversicherungsformulare, Lebensläufe usw. Es wurde dafür entwickelt, den gesamten Text in diesen Dokumenten präzise zu erkennen, einschließlich einzelner Zeichen und Ziffern — selbst wenn sich diese Informationen in Stempeln, Bildern, Logos oder Bereichen mit Kleinschrift befinden. Im Gegensatz zur standardmäßigen Dokumentanalyse für ganze Seiten wird hier davon ausgegangen, dass alle gedruckten Informationen in den Dokumenten Text sind. Außerdem wird sichergestellt, dass wichtige Textinformationen nicht als grafische Elemente identifiziert werden und Wörter oder Zahlenwerte nicht in einzelne Zeichen zerlegt werden. Dadurch stehen möglichst umfassende Informationen über den Text, einschließlich seiner Koordinaten, für die Analyse, die feldweise Verarbeitung und das Parsing in nachfolgenden Verarbeitungsschritten durch andere Systeme zur Verfügung.

Dokumentanalyse für die Volltextindizierung

Erkennt automatisch den gesamten Text in Dokumenten, einschließlich des in Bildern, Diagrammen und Schaubildern eingebetteten Textes. Entwickler können diesen Modus der Dokumentanalyse nutzen, um umfassende Volltextinformationen aus Dokumenten zu extrahieren, die für den Aufbau von Dokumentindizes benötigt werden (z. B. in DMS-, CMS- und Archivierungssystemen). intro_KeyFeatures_DocumentAnalysis

Spezifikation manueller Blöcke für die Erkennung auf Feldebene

In diesem Fall ist keine Analyse erforderlich, da das Erkennungsfeld direkt vom Benutzer oder von der Anwendung definiert wird. Der Recognizer erhält die Koordinaten des Felds und den Texttyp und führt in der angegebenen Zone eine Optical Character Recognition (OCR) aus.

Siehe auch

Wichtige Funktionen