Zum Hauptinhalt springen
Für die meisten Suchelemente der Aktivität „Extraktionsregeln“ umfasst der Bereich Eigenschaften zwei Abschnitte: Wonach gesucht wird und Wo gesucht wird. Ausnahmen sind:
  • Gruppe- und Wiederholbare Gruppe-Elemente, die keine eigenen Eigenschaften besitzen.
  • Eingabefeld-Elemente, die aus anderen Aktivitäten vor der Aktivität „Extraktionsregeln“ übernommen werden und nur die Option Region übernehmen von bieten, um von einem Eingabefeld zu einem anderen zu wechseln.

Wonach gesucht werden soll

Der Abschnitt Wonach gesucht werden soll enthält Eigenschaften, die für jedes einzelne Element spezifisch sind.

Person, Organisation, Adresse, Ort, Datum, Dauer, Betrag

Für alle Suchelemente, die nach benannten Entitäten suchen, können Sie die folgenden Eigenschaften festlegen:
  • Entitäten: Entitätstyp. Wenn Sie den Typ ändern, wird das icon beim Suchelement automatisch aktualisiert.
  • Vorkommen: Anzahl der Vorkommen. Entweder das erste oder alle gefundenen Vorkommen können extrahiert werden.

Wert aus Wörterbuch

Für eine Wörterbuchphrase geben Sie Folgendes an:
  • Textquelle: eine TXT-Datei mit einer Liste von Wörtern oder Ausdrücken, ein Eintrag pro Zeile.
  • Morphologie verwenden: Aktivieren Sie diese Option, um nach allen Wortformen zu suchen.
  • Vorkommen: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.

Wert aus regulärem Ausdruck

Für einen regulären Ausdruck geben Sie Folgendes an:
  • Regulärer Ausdruck: ein regulärer Ausdruck, der die Suche definiert. Das Programm verwendet die PCRE2-Syntax für reguläre Ausdrücke.
  • Nach Wortteilen suchen: aktivieren Sie diese Option, um Treffer zu finden, auch wenn sie nicht durch Leerzeichen vom restlichen Text getrennt sind.
  • Vorkommen: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.

Text

Für ein Textsuche-Element klicken Sie auf das Bearbeitungssymbol und geben Sie eine Liste mit zu suchenden Wörtern oder Ausdrücken ein, oder klicken Sie auf das Dokumentbild, um erkannte Wörter aus dem Dokument hinzuzufügen. Im Gegensatz zum Suchelement Value from Dictionary werden Schlüsselwörter direkt aufgelistet statt in einer TXT-Datei, und Sie haben außerdem die Möglichkeit, bestimmte Erkennungsfehler zuzulassen.
  • Text source: eine Liste von Wörtern oder Ausdrücken, die gefunden werden sollen, ein Eintrag pro Zeile.
  • Use morphology: Aktivieren Sie diese Option, um nach allen Wortformen zu suchen.
  • Allowed errors: der Prozentsatz oder die Anzahl abweichender Zeichen, bei der der Text dennoch gefunden wird. Kann bei Erkennungsfehlern hilfreich sein.
Note: Diese Option ist nicht verfügbar, wenn Sie die Option Use morphology aktivieren.
  • Instances: die Anzahl der Vorkommen. Entweder das erste oder alle erkannten Vorkommen können extrahiert werden.
Der Abschnitt Wo suchen ist für alle Elemente identisch. In diesem Abschnitt können Sie den Bereich eingrenzen, in dem das Programm nach dem Such­element sucht. In den folgenden Einstellungen können Sie die Such­elemente verwenden, die in der Liste oberhalb des aktuellen Elements stehen:
  • Suchen in: Das Such­element befindet sich entweder im gesamten Document oder innerhalb eines anderen Such­elements.
Beispiel: Suchen Sie nach dem Namen der Organisation in der Präambel des Dokuments.
  • Nach: Das Such­element befindet sich hinter einem anderen Such­element im erkannten Text.
    • Im selben Satz suchen: Aktivieren Sie diese Option, um das Element innerhalb desselben Satzes zu finden.
Beispiel: Suchen Sie nach der Rolle der Organisation nach ihrem Namen innerhalb desselben Satzes.
  • Vor: Das Such­element befindet sich vor einem anderen Such­element im erkannten Text.
    • Im selben Satz suchen: Aktivieren Sie diese Option, um das Element innerhalb desselben Satzes zu finden.
Wenn Sie beispielsweise nach dem Geburtsdatum einer Person suchen, können Sie zunächst ein Hilfs‑Such­element mit dem Schlüsselwort „geboren“ erstellen und dann angeben, dass sich die Entität Date irgendwo nach diesem Schlüsselwort innerhalb desselben Satzes befindet. Sie können mehrere Nach- und Vor-Elemente hinzufügen, um Ihre Suche weiter zu verfeinern.