Zum Hauptinhalt springen
ABBYY FlexiCapture ist eine Softwarelösung für die Datenerfassung aus Dokumenten verschiedener Typen in einem einzigen Verarbeitungsfluss. In einem einzigen Verarbeitungsfluss können verschiedene Dokumente verarbeitet werden. Sie können das Programm auch so einrichten, dass Dokumente gemischten Typs verarbeitet werden, z. B. Dokumente, die sowohl strukturierte als auch semistrukturierte Abschnitte enthalten. Der Dokumenttyp wirkt sich nur auf die Systemkonfiguration aus, nämlich auf die Methode zum Erstellen von DokumentdefinitionenDokumentdefinitionen. Die Art der Arbeit des Operators wird vom Typ der verarbeiteten Dokumente nicht beeinflusst. ABBYY FlexiCapture kann für die automatisierte Eingabe der folgenden Dokumente konfiguriert werden, auch innerhalb eines einzigen Verarbeitungsflusses:
Strukturierte Formulare sind Dokumente mit einer Reihe markierter Informationsfelder, deren Formatierung, Anzahl und Anordnung sich von einer Dokumentinstanz zur nächsten nicht ändert. Solche Dokumente werden feste Formulare genannt. Die meisten Fragebögen und Antragsformulare sind zum Beispiel feste Formulare. Solche Formulare werden in der Regel als Leerformulare bereitgestellt und von Hand ausgefüllt.Um ein festes Formular in einem Dokumentenfluss zu identifizieren und Daten daraus zu extrahieren, müssen Sie ein einziges festes Layout erstellen, das dem Programm die Position der Felder angibt, die die zu extrahierenden Daten enthalten.Feste Formulare, die so erstellt wurden, dass sie die Anforderungen der automatischen Eingabe erfüllen, lassen sich am effektivsten verarbeiten. Solche Formulare werden maschinenlesbare Formulare genannt. Weitere Informationen zu den Anforderungen an solche Formulare und zu den Methoden ihrer Erstellung finden Sie im Abschnitt Erstellen maschinenlesbarer Formulare.Das Programm enthält ein praktisches Werkzeug zum Entwerfen maschinenlesbarer Formulare: ABBYY FormDesigner (wird zusammen mit ABBYY FlexiCapture geliefert). Informationen zum Entwerfen von Formularen mit ABBYY FormDesigner finden Sie im Benutzerhandbuch und in den Hilfethemen.Die grundlegenden Phasen beim Erstellen einer Dokumentdefinition werden speziell für strukturierte Dokumente beschrieben.Hinweis: Per Fax empfangene feste Formulare können verzerrt sein: Ihre Größe und die relativen Positionen ihrer Felder können verändert sein. Daher empfehlen wir, zur Erhöhung der Erkennungsqualität bei der Verarbeitung solcher Formulare ein FlexiLayout zu verwenden.
Dies sind Dokumente mit einer Reihe von Informationsfeldern, deren Gestaltung, Anzahl und Anordnung in verschiedenen Instanzen des Dokuments erheblich variieren kann. Diese Dokumente werden flexibel genannt. Rechnungen sind zum Beispiel semistrukturierte Dokumente, da sie sich häufig sowohl hinsichtlich der Anzahl der Positionen als auch ihrer Formatierung unterscheiden, weil sie von verschiedenen Unternehmen stammen. Alle Rechnungen haben eine Rechnungsnummer und einen fälligen Betrag, diese befinden sich jedoch an unterschiedlichen Stellen.Um flexible Formulare zu identifizieren und Daten daraus zu extrahieren, verwendet ABBYY FlexiCapture ein flexibles Layout (FlexiLayout). Ein flexibles Layout wird mit Hilfe eines speziellen Moduls namens ABBYY FlexiLayout Studio erstellt. Einzelheiten zu diesem Modul finden Sie im Benutzerhandbuch und in den Hilfethemen.Die Verarbeitung semistrukturierter Dokumente unterscheidet sich von der Verarbeitung fester Formulare nur in der Phase des Erstellens und Ladens eines Layouts. Einzelheiten finden Sie unter Erstellen einer Dokumentdefinition für die Verarbeitung semistrukturierter Dokumente.
ABBYY FlexiCapture kann zur Verarbeitung unstrukturierter Dokumente verwendet werden, die Informationen in freier Form enthalten, zum Beispiel Verträge, Briefe, Bestellungen und Diagramme. Das Programm kann unstrukturierte Dokumente automatisch als Anhänge an feste oder flexible Formulare identifizieren, oder es kann sie mit Hilfe eines flexiblen Layouts identifizieren und dann als durchsuchbare PDF-Dateiendurchsuchbare PDF-Dateien oder als Grafikdateien exportieren. Sie können Indexfelder aus unstrukturierten Dokumenten sowohl automatisch mit Hilfe eines flexiblen Layouts als auch durch manuelle Eingabe extrahieren.NLP kann zur Verarbeitung unstrukturierter Dokumente verwendet werden. Diese Technologie verwendet NLP-Modelle, um Informationen aus Text zu extrahieren.Ein typisches Szenario für die Verarbeitung unstrukturierter Dokumente ist die Umwandlung eines Papierarchivs in elektronische Form, wobei zwei oder drei Indexfelder extrahiert werden sollen, um eine schnelle attributbasierte Suche zu ermöglichen.Einzelheiten finden Sie unter Erstellen von Dokumentdefinitionen für unstrukturierte und semistrukturierte Dokumente.