Zum Hauptinhalt springen
Ein FlexiLayout ist eine formalisierte Beschreibung einer Menge unstrukturierter Dokumente, die es einer Anwendung zur Datenerfassung ermöglicht, Datenfelder in Dokumenten zu lokalisieren und Informationen aus diesen Feldern zu extrahieren. Für jedes Objekt oder jede Gruppe von Objekten, die in einem Dokumentbild erkannt werden müssen, wird ein FlexiLayout-Element erstellt. Die Eigenschaften des Elements beschreiben die Merkmale des entsprechenden Objekts. So teilt das Element dem Programm mit, ob das gesuchte Objekt ein Bild, ein Textfragment oder ein Barcode ist, wie groß es ist und wo es in einem Dokumentbild am wahrscheinlichsten zu finden ist. Ein FlexiLayout-Block gibt dem Programm vor, wo nach Objekten gesucht werden soll, aus denen Daten erfasst werden müssen. Blockkoordinaten können direkt oder mithilfe von Elementen angegeben werden. ABBYY FlexiLayout Studio bietet eine benutzerfreundliche grafische Oberfläche, mit der Sie FlexiLayouts aus Elementen und Blocks erstellen können. Die Erstellung von FlexiLayouts erfordert jedoch ein gewisses Maß an Kreativität, da ein und dasselbe Objekt oft auf mehr als eine Weise erkannt werden kann und der Benutzer entscheiden muss, welche Erkennungsstrategie verwendet werden soll. Die Erstellung eines FlexiLayouts umfasst die folgenden Stufen:

Ein Projekt ist eine Datei, die alle FlexiLayout-Daten enthält. Darin wird die formalisierte Beschreibung des Layouts gespeichert; die Datei wird zum Kompilieren und Testen des FlexiLayouts verwendet.

Mehr…

Ein Batch ist eine Gruppe von Beispiel-Dokumentbildern, die für alle zu verarbeitenden Dokumente repräsentativ sein müssen.

Mehr…

Die Vorerkennung ist ein Prozess, bei dem ABBYY FlexiLayout Studio atomare Objekte auf einem Bild erkennt, etwa Textfragmente, Trennlinien, Kontrollkästchen usw. Die Vorerkennung vermittelt Ihnen einen Eindruck davon, wonach Sie in den Dokumenten eines Batch suchen können.

Mehr…

Sobald ein Dokument vorerkannt wurde, müssen Sie es analysieren, um Objekte zu finden, die in allen Dokumenten im Batch zuverlässig erkannt werden können. Darauf sollten Sie achten:

  • Objekte, die sich auf allen Dokumenten genau an derselben Stelle befinden (z. B. Logos, Kopfzeilen, Titel und ähnliche Objekte);
  • Objekte, die zuverlässig erkannt wurden und auf allen Dokumentabbildungen vorhanden sind;
  • Objekte, die von der Druck- oder Scanqualität kaum beeinflusst werden;

Wenn es genügend solcher Objekte gibt, können Sie die Positionen aller anderen Objekte auf den Dokumenten relativ zu diesen Objekten beschreiben. In diesem Stadium können Sie außerdem die beste Methode auswählen, um nach einem bestimmten Objekt im Dokument zu suchen.

Mehr …

Zuerst müssen Sie Elemente für Objekte erstellen, die erkannt werden können, ohne andere Objekte im Dokument heranzuziehen (zum Beispiel einen Titel oder ein anderes Textfragment, das in jedem Dokument vorkommt). Anschließend werden die Positionen der übrigen Objekte relativ zu bereits erstellten Elementen beschrieben. Die FlexiLayout-Elemente bilden dabei einen Elementbaum – von den zuverlässigsten Objekten bis zu den am wenigsten zuverlässigen.

Wenn das Dokument Objekte enthält, die eine Dokumentgruppe von anderen Gruppen unterscheiden, sollten Elemente für solche Objekte zuerst erstellt werden. Diese Objekte werden als Bezeichner verwendet, damit FlexiLayouts, die für eine Dokumentgruppe erstellt wurden, nicht versehentlich mit Dokumenten aus einer anderen Gruppe abgeglichen werden. Dadurch wird die Dokumentverarbeitung beschleunigt und die Datenerfassung zuverlässiger.

Nur der Benutzer kann entscheiden, welche Elemente und Blöcke zuerst erstellt werden müssen. Wir empfehlen jedoch, das FlexiLayout nach jedem neu erstellten Element oder Block zu testen, um sicherzustellen, dass das neue Element tatsächlich dazu verwendet werden kann, das von ihm beschriebene Objekt in allen Beispielbildern zu erkennen.

Es kann hilfreich sein, das Dokument visuell in mehrere logische Teile zu gliedern und die Bildobjekte jedes Teils nacheinander zu beschreiben. Dies erleichtert das spätere Debuggen des FlexiLayout.

Mehr…

Wenn Sie ein FlexiLayout kompilieren, prüft das Programm seine Logik und Konsistenz.

Mehr …

Um Ihr FlexiLayout zu testen, sollten Sie es per Matching mit Beispieldokumentbildern prüfen. Das FlexiLayout muss nicht nur zu allen Beispielbildern passen, sondern es dem Programm auch ermöglichen, die entsprechenden Objekte korrekt zu erkennen. Wir empfehlen, Ihre FlexiLayouts nach jedem neu hinzugefügten Element oder Block zu testen. Fehler im FlexiLayout lassen sich in diesem Stadium deutlich leichter erkennen als in einem vollständigen FlexiLayout, insbesondere wenn Ihre Dokumente komplexe Layouts aufweisen.

Mehr…

Sobald das FlexiLayout fertiggestellt ist, muss es aus ABBYY FlexiLayout Studio exportiert und in eine Datenerfassungsanwendung importiert werden.

Mehr…