Zum Hauptinhalt springen
Ein Suchelement ist die Beschreibung eines oder mehrerer Dokumentbildobjekte, mit der Sie Suchbedingungen für ein Objekt in einem bestimmten Bereich festlegen können. Ein Element enthält Informationen über den Typ des gesuchten Bildobjekts, die Eigenschaften des Objekts und dessen Suchbereich. Die mithilfe der Eigenschaften des Elements erzielten Suchergebnisse werden von der Aktivität verwendet, um Regionen für auf dem Bild erkannte Objekte zu bilden — einen Bereich, der aus einem oder mehreren Rechtecken besteht, die das erkannte Objekt umfassen. Die Position von Feldern und anderen Elementen wird anschließend relativ zur Position der erkannten Elemente bestimmt. Um ein Element zu erstellen, klicken Sie auf Element erstellen und wählen Sie in der angezeigten Liste den entsprechenden Elementtyp aus. Nachdem ein Element erstellt wurde, richten Sie seine Eigenschaften im Bereich Eigenschaften ein (siehe Elementeigenschaften für weitere Informationen). Die angegebenen Eigenschaften können auch im Codeformat angezeigt und bearbeitet werden (siehe FlexiLayout Language für weitere Informationen). Elemente können je nach Struktur des Dokuments im Baum verschoben werden. Beachten Sie, dass die Position der Elemente im Baum ihre Suchreihenfolge bestimmt. Die Suche nach Elementen erfolgt in absteigender Reihenfolge. Wenn Sie ein Suchelement erstellen, wählen Sie dessen Typ abhängig davon, welches Objekt Sie finden möchten. Unten finden Sie kurze Beschreibungen der in der Aktivität „Extraction Rules“ verfügbaren Suchelementtypen. Nachdem Sie das Suchelement erstellt haben, konfigurieren Sie dessen Eigenschaften, die hier beschrieben sind.

Statischer Text

Dieses Element beschreibt vordefinierten Text. Die meisten Dokumentbilder enthalten in der Regel statischen Text. Dabei kann es sich entweder um den Namen des Dokuments (zum Beispiel „Rechnung“) oder um zusätzliche Beschriftungen für Datenfelder handeln (z. B. „Datum“, „an:“, „von:“). Solcher Text wird während der Vorab-Erkennung als Recognized Words-Objekt erkannt und dient üblicherweise als Anker, um Werte für die entsprechenden Felder zu ermitteln (zum Beispiel steht das Datum typischerweise neben der Beschriftung „Datum“). Dieser Text kann aus einem Wort oder einer Wortgruppe bestehen. Wortgruppen unterscheiden sich von Wörtern dadurch, dass sie mindestens ein Leerzeichen enthalten. Eine Wortgruppe kann auch über mehrere Zeilen verteilt sein. Bei der Suche nach diesem Element werden während der Bildvorerkennung erkannte Recognized Words- und Recognized Lines-Objekte berücksichtigt, die sich im Suchbereich des Elements befinden.

Zeichenfolge

Dieses Element beschreibt eine Folge von Zeichen in einer einzelnen Zeile (von links nach rechts). Zeichenfolgen werden aus erkannten Textobjekten (Recognized Words) zusammengestellt, z. B. aus ganzen Wörtern oder mehreren Fragmenten von Textobjekten. Dieses Element ist für die Suche nach nicht vordefiniertem Text vorgesehen. Dabei werden Recognized-Words-Objekte berücksichtigt, die während der Bildvorerkennung erkannt wurden und sich innerhalb des Suchbereichs des Elements befinden. In der Regel sucht die Aktivität nach Zeichenfolgen in Bereichen um statischen Text, der bereits erkannt wurde. Wenn beispielsweise nach einer Rechnungsnummer gesucht wird, muss zunächst der statische Text „Invoice No.“ gefunden werden. Anschließend sucht die Aktivität in derselben Zeile rechts neben dem statischen Text nach einer Zeichenfolge (in diesem Fall nur Zahlen).
Hinweis: Die Aktivität sucht aufgrund der Leserichtungseinschränkung nicht nach Zeichenfolgen-Elementen in Arabisch und Hebräisch.

Absatz

Dieses Element beschreibt einen Textabsatz. Eine Suche mit diesem Element berücksichtigt alle Textobjekte, die den Suchbereich schneiden. Dieses Element ist dafür vorgesehen, nach nicht vordefinierten Textabsätzen zu suchen. Während der Vorerkennung erkannte Objekte der Typen Recognized Words und Recognized Lines, die sich im Suchbereich des Elements befinden, werden berücksichtigt.

Schlüssel-Wert

Dies ist ein Gruppenelement, das für die Suche nach Feldern mit einer Beschriftung vorgesehen ist. Um dieses Element zu erstellen, müssen Sie die Eigenschaften der Beschriftung, das primäre Suchfeld und den Abstand zwischen beiden angeben. Sie können außerdem einen Typ und passende Eigenschaften für das Primärelement festlegen. Statischer Text und Weißraum dienen als sekundäre Suchkriterien für das primäre Feld. Bei der Suche nach statischem Text werden die während der Bildvorerkennung erkannten Objekte Recognized Words und Recognized Lines berücksichtigt, die sich innerhalb des Suchbereichs des Elements befinden. Sobald das statische Textelement erkannt wurde, sucht die Aktivität das entsprechende Feld, das den Elementwert enthält.

Datum

Dieses Element beschreibt das Datum. Datumsangaben können in unterschiedlichen Formaten erfolgen: Tag und Jahr werden stets als Zahlen geschrieben, während der Monat mitunter auch in Buchstaben angegeben wird. Das Datumsformat wird vom Benutzer festgelegt.

Geldbetrag

Dieses Element beschreibt Zahlenwerte, die entweder ganze Zahlen sind oder zwei Dezimalstellen haben. Standardmäßig ist ein Platzhalter für den Dezimalteil zulässig. Zum Beispiel wird 12. als 12,00 erkannt. Der Ganzzahlteil kann mithilfe von Trennzeichen in Gruppen gegliedert werden (Leerzeichen und die folgenden Symbole sind standardmäßig als Trennzeichen zulässig: . , ’). Die gesuchte Zahl kann ein Präfix und ein Suffix haben, zum Beispiel ein Textelement, das vor oder nach dem Zahlenwert steht. Das Präfix muss sich in derselben Zeile wie der Zahlenwert befinden. Dieses Format wird üblicherweise für Geldbeträge verwendet, wobei der Währungsname als Präfix dient.

Telefon

Dieses Element beschreibt eine Telefonnummer, die in der Regel von einem Schlüsselwort begleitet wird (z. B. „Tel.“, „Privat“, usw.) und eine Stadt-/Regionsvorwahl enthält, die durch Klammern vom restlichen Teil der Nummer getrennt ist. Die Telefonnummer und das entsprechende Schlüsselwort müssen in derselben Zeile stehen.

Bereich

Dieses Element repräsentiert einen Bereich auf einem Dokumentbild, ohne Festlegungen zu dessen Inhalt. Das Element Bereich kann aus mehreren nicht zusammenhängenden Teilbereichen bestehen. Es wird in der Aktivität verwendet, um Bereiche unabhängig von den darin enthaltenen Objekten zu markieren. Dieses Element sollte verwendet werden, wenn dasselbe Feld in unterschiedlichen Dokumenten mithilfe verschiedener Elemente erkannt wird, z. B. Datum und string, um nach einem Datum zu suchen, das sowohl in standardisierten als auch in nicht standardisierten Formaten angegeben ist. In diesem Fall sind Datum und string sekundäre Elemente, während Bereich zum Erfassen der Extraktionsergebnisse verwendet wird.

Separator

Dieses Element beschreibt einen vertikalen oder horizontalen Separator. Es dient dazu, Separatoren zu erkennen. Separator-Objekte, die während der Bildvorerkennung erkannt wurden und sich vollständig innerhalb des Suchbereichs des Elements befinden, werden berücksichtigt. Diese Objekte können sich entweder vollständig innerhalb des Suchbereichs befinden oder diesen lediglich kreuzen.

Weißer Zwischenraum

Dieses Element beschreibt einen rechteckigen Bereich im Bild, der nahezu nie andere Objekte enthält. Es kann als sekundäres Element für die Suche nach anderen Elementen verwendet werden. Wenn beispielsweise auf den zu verarbeitenden Dokumenten stets ein weißer Zwischenraum zwischen der Adresse und der Dokumentkopfzeile vorhanden ist, kann ein Element „Weißer Zwischenraum“ verwendet werden, um das Element zu finden, das die Adresse enthält.

Barcode

Dieses Element beschreibt Barcodes. Es ist darauf ausgelegt, die von Advanced Designer unterstützten Barcode-Typen zu erkennen. Barcode-Objekte, die während der Bildvorerkennung erkannt und innerhalb des Suchbereichs des Elements lokalisiert wurden, werden berücksichtigt.

Objektsammlung

Dieses Element beschreibt eine Sammlung von Objekten unterschiedlicher Typen, die alle die Suchkriterien erfüllen. Das Element „Objektsammlung“ wird in der Regel verwendet, um nach Objekten zu suchen, die mit keinem anderen Elementtyp erkannt werden können. So lässt sich damit beispielsweise nach einzelnen Satzzeichen suchen, die nicht Teil einer Textzeile oder anderer Textobjekte sind, sowie nach Text, der aufgrund zahlreicher störender Objekte nicht erkannt werden konnte. Dieses Element kann außerdem verwendet werden, um Nicht-Text-Objekte wie Bilder und Markierungen zu finden.

Gruppe

Dies ist eine Sammlung mehrerer anderer Elemente (genannt Unterelemente). Unterelemente können sowohl einfache als auch Gruppenelemente sein. Wir empfehlen nicht, Gruppenelemente ohne Unterelemente zu verwenden. Gruppenelemente können für Folgendes verwendet werden:
  • Elemente zusammenfassen. Dadurch wird das Debuggen unabhängiger Teile Ihrer Aktivität mit Extraktionsregeln einfacher. Beispiel: Ihre Aktivität kann 100 Elemente enthalten, die in 3 Teile aufgeteilt sind: Kopfzeile, Hauptteil, Fußzeile. Jedes dieser 3 Gruppenelemente enthält weitere Gruppenelemente, die darauf ausgelegt sind, kleine Fragmente des logischen Teils Ihrer Aktivität zu finden. Neben der Reduzierung der Anzahl der Möglichkeiten, die von der Aktivität berücksichtigt werden müssen, stellt eine solche Struktur sicher, dass Debuggen und Bearbeiten in Zukunft einfacher ist, da alles in unabhängige Teile aufgeteilt ist.
  • Sicherstellen einer logischen Hierarchie der Elemente im Baum, was die Navigation in der Aktivität erleichtert.
  • Reduzieren der möglichen Anzahl von Elementhypothesen, was die Suche nach der resultierenden Hypothese für die Aktivität als Ganzes beschleunigt. Das Zusammenfassen von Elementen ermöglicht es, diese Gruppe von Elementen als eine einzelne Einheit mit eigener Hypothese zu betrachten, was eine Qualitätsmessung für die Gruppe als Ganzes ermöglicht.
  • Ein Verbundelement ermöglicht es Ihnen, Suchbereichsbeschränkungen festzulegen, die für alle Unterelemente gelten. Der Suchbereich für ein bestimmtes Unterelement eines Gruppenelements wird als Schnittmenge der Suchbereiche des Unterelements und des Gruppenelements berechnet.
Elemente (sowohl Gruppen- als auch einfache) können erforderlich, optional oder verboten sein. Wenn ein optionales Verbundelement ein erforderliches Unterelement enthält, führt das Nichtabgleichen des Unterelements zur Formulierung der Nullhypothese für das Gruppenelement. Dies unterbricht das Abgleichen der Aktivität mit Extraktionsregeln nicht.

Wiederholbare Gruppe

Dieses Element ist dafür ausgelegt, nach wiederholbaren Elementgruppen (mit unbekannter Anzahl von Instanzen) zu suchen. Ein gängiges Beispiel ist eine Datentabelle. Ein wiederholbares Element unterscheidet sich von einem regulären zusammengesetzten Element hinsichtlich seiner Wiederholungsparameter. Diese Gruppe kann mehrfach auf einer einzelnen Seite sowie im gesamten Dokument auftreten. Da sich diese Gruppe innerhalb eines Dokuments wiederholt, können mit diesem Element alle ihre Instanzen (einschließlich der Wiederholungsparameter) als ein einziges Element beschrieben werden. Auf diese Weise lässt sich die Dokumentstruktur mit der Wiederholbaren Gruppe deutlich schneller modellieren. Dieses Element kann für Folgendes verwendet werden:
  • Suchen nach Tabellen.
  • Suchen nach einer Kopfzeile auf jeder Seite eines mehrseitigen Dokuments.
  • Suchen nach einer unbekannten Anzahl wiederholter Dateneinträge.

Eingabefeld

Dieses Element dient dazu, einen von einer anderen Aktivität extrahierten Feldbereich zu erkennen. Es kann verwendet werden, um andere Elemente zu finden. Wenn beispielsweise ein Skill ein Feld enthält, das nach dem Training stets im Bild vorhanden ist, kann es bei der Suche nach Elementen mithilfe einer Extraction Rules-Aktivität als Ankerfeld verwendet werden. Erstellen Sie dazu ein Eingabefeld-Element und wählen Sie das entsprechende Feld in der Skill-Struktur aus. Dadurch wird ein Region-Element erstellt, das Code enthält, der das Element mit dem ausgewählten Feld auf der Registerkarte Search Conditions verknüpft.

Deep Learning

Dieses Element ermöglicht den Zugriff auf einen Wert, der von einer Deep-Learning-Aktivität gefunden wurde, die ihre Ausgabe an die Aktivität „Extraction Rules“ innerhalb eines „Hypothesis Filtering“-Containers übergibt. Dieses Element ist nur innerhalb eines „Hypothesis Filtering“-Containers verfügbar. Sie können die Ausgabe einer Deep-Learning-Aktivität steuern, indem Sie Bedingungen für dieses Suchelement festlegen. Wenn die Deep-Learning-Aktivität beispielsweise so konfiguriert ist, dass ein wiederkehrender Wert gefunden wird, können Sie die bevorzugte Position der Instanz festlegen, die Sie extrahieren möchten.