Zum Hauptinhalt springen
Ein Such-Element ermöglicht es, Bedingungen für den Typ und die Eigenschaften eines zu extrahierenden Objekts festzulegen. Da NLP-Aktivitäten mit unstrukturiertem Text arbeiten, geben Suchbedingungen die Position von Objekten im Verhältnis zu anderem Text an, statt deren geometrische Beziehung. Sie können außerdem zusätzliche Such-Elemente verwenden, um die Suche einzugrenzen und festzulegen, dass sich das gewünschte Objekt innerhalb, vor oder nach solchen zusätzlichen Elementen befindet.

Erstellen eines Suchelements

  • Sie können ein Suchelement schnell erstellen, indem Sie auf eines der im Bild hervorgehobenen Objekte klicken. Das neue Suchelement hat denselben Typ wie das Objekt, auf das Sie klicken. Verwenden Sie die Schaltfläche Bildobjekte anzeigen in der Symbolleiste, um die hervorzuhebenden Objekte auszuwählen.

Hervorheben von Objekten

Die folgenden Objekttypen können hervorgehoben werden:
  • Person
  • Organisation
  • Adresse
  • Ort
  • Datum
  • Dauer
  • Geldbetrag
  • Erkannte Wörter
Hinweis: Alle diese Objekte werden standardmäßig hervorgehoben, mit Ausnahme der erkannten Wörter.
  • Sie können auch über das Menü ein neues Suchelement erstellen:
  1. Wechseln Sie zur Registerkarte Search Elements rechts im Dokumentfenster.
  2. Klicken Sie auf Create Element.
  3. Wählen Sie in der sich öffnenden Liste den gewünschten Elementtyp aus.
Nachdem das Element erstellt wurde, konfigurieren Sie seine Eigenschaften im Bereich Properties (siehe Elementeigenschaften für weitere Informationen).
Hinweis: Die angegebenen Eigenschaften können auch im Codeformat angezeigt und bearbeitet werden (siehe Codesyntax für die Aktivität Extraction Rules for NLP für weitere Informationen).

Typen von Suchelementen

Wenn Sie ein Suchelement erstellen, müssen Sie dessen Typ angeben; dieser hängt von dem Objekt ab, das Sie finden möchten. Die verfügbaren Typen von Suchelementen werden nachfolgend kurz beschrieben.

Person

Personennamen, zum Beispiel: John Doe, Jane Smith.

Organisation

Namen von Organisationen, zum Beispiel ABBYY, Acme Corp.

Adresse

Adressen, zum Beispiel: 123 Main St., Anytown AB 45678.

Ort

Namen von Standorten, zum Beispiel: Anytown, Corporate Place.

Datum

Datumsangaben in unterschiedlichen Formaten, zum Beispiel: 14. November 2009, 11/14/2009.

Dauer

Zeitangaben, zum Beispiel: zwölf (12) Monate, 4 Tage.

Money

Geldbeträge, zum Beispiel: $2,670.00, 199 Dollar und 99 Cent. Hinweis: Die Elemente Person, Organization, Address, Location, Date, Duration und Money entsprechen den benannten Entitäten, die Sie in der Aktivität Named Entities (NER) konfigurieren können, und werden mit derselben Technologie extrahiert.

Wert aus dem Wörterbuch

Ein Wort oder eine Phrase aus einem Wörterbuch. Das Wörterbuch sollte eine einfache TXT-Datei mit einer Liste von Varianten des Suchtexts sein, eine Variante pro Zeile.

Wert aus regulärem Ausdruck

Ein Wert, der einem von Ihnen definierten regulären Ausdruck entspricht.

Text

Ein Schlüsselwort oder eine Wortgruppe mit der Option, nach allen Wortformen zu suchen oder gewisse Erkennungsfehler zuzulassen.

Gruppe

Eine Sammlung verschachtelter Suchelemente. Die Elemente, aus denen eine Gruppe besteht, können sowohl einfache als auch Gruppenelemente sein. Ein Gruppenelement hat keine eigenen Eigenschaften. Daten werden anhand der Einstellungen seiner verschachtelten Suchelemente extrahiert. Gruppenelemente können verwendet werden, um eine logische Hierarchie von Elementen durchzusetzen und so Debugging und Navigation zu erleichtern. Wenn Sie beispielsweise den Namen, die Adresse und das Geburtsdatum einer Person gruppieren, können die Daten zu jeder Person konsistent extrahiert werden.

Wiederholbare Gruppe

Dieses Element dient dazu, nach wiederholbaren Gruppen von Elementen zu suchen. Wiederholbare Gruppen eignen sich für Fälle, in denen eine Entität mehrere Instanzen haben kann, jede mit eigenen Eigenschaften, Sie jedoch nicht wissen, wie viele Instanzen es geben wird. Die Eigenschaften jeder Instanz werden in den verschachtelten Elementen der wiederholbaren Gruppe definiert. Wenn Sie beispielsweise Lebensläufe verarbeiten, möchten Sie möglicherweise eine wiederholbare Gruppe „Education“ mit den folgenden verschachtelten Elementen erstellen: „School_name“, „Degree“, „Start_date“ und „Graduation_date“. Beziehen sich die gesuchten Daten hingegen auf verschiedene Entitäten mit unterschiedlichen Rollen, ist eine wiederholbare Gruppe nicht die richtige Wahl. Haben Sie beispielsweise nur zwei Parteien in einem Vertrag, etwa Käufer und Verkäufer, erstellen Sie eine Gruppe „Party1_Buyer“ und eine Gruppe „Party2_Seller“ anstelle einer einzelnen wiederholbaren Gruppe „Party“.

Eingabefeld

Mit diesem Element können Sie ein von einer anderen Aktivität extrahiertes Feld als Baustein für Regeln verwenden. Wenn einer Aktivität „Extraktionsregeln“ beispielsweise eine Segmentierungsaktivität vorausgeht, möchten Sie möglicherweise einige Segmente nutzen, um die Suche einzugrenzen.

Ändern des Typs, Namens und der Position eines Elements in der Liste

So ändern Sie den Typ eines Elements:
  • Klicken Sie mit der rechten Maustaste auf ein Element und wählen Sie im Kontextmenü Element konvertieren in.
  • Wählen Sie ein Element in der Liste aus und klicken Sie auf ein hervorgehobenes Objekt im Bild. So können Sie das ausgewählte Suchelement in den Typ des hervorgehobenen Objekts konvertieren. Wenn Sie auf ein hervorgehobenes erkanntes Wort klicken, können Sie das Suchelement in Text konvertieren und gleichzeitig das ausgewählte Wort zur Liste der Schlüsselwörter für dieses Suchelement hinzufügen.
  • Für Suchelemente, die benannten Entitäten entsprechen, verwenden Sie die Eigenschaft Entities, um den Typ der benannten Entität zu ändern.
Hinweis: Das Ändern des Typs eines Elements wandelt keine Nicht-Gruppenelemente in Gruppenelemente um und umgekehrt.
So ändern Sie den Namen eines Elements:
  • Klicken Sie mit der rechten Maustaste auf ein Element, wählen Sie im Kontextmenü Umbenennen und geben Sie einen neuen Namen ein.
  • Wählen Sie ein Element aus, klicken Sie auf seinen Namen (oder drücken Sie F2) und geben Sie einen neuen Namen ein.
Ein Elementname kann englische Buchstaben, Ziffern und Unterstriche enthalten. Er darf jedoch nicht mit einer Ziffer beginnen. Leerzeichen, Sonderzeichen (.,:- \ /) und reservierte Namen sind nicht zulässig. So verschieben Sie Elemente in der Liste:
  • Ziehen Sie Elemente nach oben oder unten, um ihre Position in der Liste zu ändern.
  • Ziehen Sie Elemente auf ein Gruppenelement, um sie in die Gruppe zu verschieben.
Hinweis: Elemente werden von oben nach unten gesucht. Das bedeutet, dass Elemente, die in den Suchbedingungen eines anderen Elements verwendet werden, diesem in der Elementliste vorausgehen müssen.