Zum Hauptinhalt springen
Für die meisten Suchelemente der Aktivität Extraction Rules enthält der Bereich Properties zwei Abschnitte: What to search for und Where to search. Ausnahmen sind:
  • Group- und Repeating Group-Elemente, die keine eigenen Eigenschaften haben.
  • Eingabefeldelemente, die aus anderen Aktivitäten vor der Aktivität Extraction Rules übernommen werden und nur die Option Get region from bereitstellen, um von einem Eingabefeld zu einem anderen zu wechseln.

Wonach gesucht werden soll

Der Abschnitt Wonach gesucht werden soll enthält Eigenschaften, die für jedes einzelne Element spezifisch sind.

Person, Organisation, Adresse, Ort, Datum, Dauer, Betrag

Für alle Suchelemente, die nach benannten Entitäten suchen, können Sie die folgenden Eigenschaften festlegen:
  • Entitäten: Entitätstyp. Wenn Sie den Typ ändern, wird das icon beim Suchelement automatisch aktualisiert.
  • Vorkommen: Anzahl der Vorkommen. Entweder das erste oder alle gefundenen Vorkommen können extrahiert werden.

Wert aus Wörterbuch

Für eine Wörterbuchphrase geben Sie Folgendes an:
  • Textquelle: eine TXT-Datei mit einer Liste von Wörtern oder Ausdrücken, ein Eintrag pro Zeile.
  • Morphologie verwenden: Aktivieren Sie diese Option, um nach allen Wortformen zu suchen.
  • Vorkommen: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.

Wert aus regulärem Ausdruck

Für einen regulären Ausdruck geben Sie Folgendes an:
  • Regulärer Ausdruck: ein regulärer Ausdruck, der die Suche definiert. Das Programm verwendet die PCRE2-Syntax für reguläre Ausdrücke.
  • Nach Wortteilen suchen: aktivieren Sie diese Option, um Treffer zu finden, auch wenn sie nicht durch Leerzeichen vom restlichen Text getrennt sind.
  • Vorkommen: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.

Text

Für ein Text-Suchelement klicken Sie auf das Bearbeitungssymbol und geben Sie eine Liste von Wörtern oder Ausdrücken ein, nach denen gesucht werden soll, oder klicken Sie auf das Dokumentbild, um erkannte Wörter aus dem Dokument hinzuzufügen. Im Gegensatz zum Suchelement Wert aus Wörterbuch werden die Schlüsselwörter direkt angegeben statt in einer TXT-Datei, und Sie können außerdem bestimmte Erkennungsfehler zulassen.
  • Textquelle: eine Liste von Wörtern oder Ausdrücken, nach denen gesucht werden soll, eine Variante pro Zeile.
  • Morphologie verwenden: Aktivieren Sie diese Option, um nach allen Wortformen zu suchen.
  • Zulässige Fehler: der Prozentsatz oder die Anzahl abweichender Zeichen, bei denen der Text dennoch gefunden wird. Hilfreich bei Erkennungsfehlern.
Hinweis: Diese Option ist nicht verfügbar, wenn Sie die Option Morphologie verwenden aktivieren.
  • Vorkommen: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.
Der Abschnitt Wo suchen ist für alle Elemente identisch. In diesem Abschnitt können Sie den Bereich eingrenzen, in dem das Programm nach dem Suchelement sucht. In den folgenden Einstellungen können Sie die Suchelemente verwenden, die in der Liste oberhalb des aktuellen Elements stehen:
  • Suchen in: Das Suchelement befindet sich entweder im gesamten Dokument oder innerhalb eines anderen Suchelements.
Beispiel: Suchen Sie nach dem Namen der Organisation in der Präambel des Dokuments.
  • Nach: Das Suchelement befindet sich nach einem anderen Suchelement im erkannten Text.
    • Im selben Satz suchen: Aktivieren Sie diese Option, um das Element im selben Satz zu finden.
Beispiel: Suchen Sie nach der Rolle der Organisation nach ihrem Namen im selben Satz.
  • Vor: Das Suchelement befindet sich vor einem anderen Suchelement im erkannten Text.
    • Im selben Satz suchen: Aktivieren Sie diese Option, um das Element im selben Satz zu finden.
Wenn Sie beispielsweise nach dem Geburtsdatum einer Person suchen, können Sie zunächst ein zusätzliches Suchelement mit dem Schlüsselwort „geboren“ erstellen und dann angeben, dass sich die Entität Date irgendwo nach diesem Schlüsselwort im selben Satz befindet. Sie können mehrere Nach- und Vor-Elemente hinzufügen, um Ihre Suche weiter zu verfeinern.