Zum Hauptinhalt springen
Die Aktivität für benannte Entitäten (NER) ist dafür konzipiert, mittels Natural Language Processing (NLP) benannte Entitäten aus unstrukturierten Dokumenten zu extrahieren, etwa aus Verträgen, Schreiben, Bestellungen, Pressemitteilungen und anderen Dokumenten ohne eindeutige, regelbasiert beschreibbare Struktur. Um diese Dokumente mit einer Aktivität für benannte Entitäten (NER) zu verarbeiten, müssen Sie die benannten Entitäten den Skill-Feldern zuordnen, in die die Entitätswerte extrahiert werden. Diese Aktivität analysiert anschließend das Dokument und extrahiert die benannten Entitäten in die entsprechenden Felder. Sie können die Extraktion benannter Entitäten auch für Felder einrichten, die von anderen Aktivitäten extrahiert werden. Angenommen, Sie wissen, dass die zu extrahierenden Organisationsnamen und Adressen im ersten Absatz jedes Vertrags stehen. Sie können den ersten Absatz mit einer Segmentation-Aktivität extrahieren und anschließend die Firmennamen und Adressen aus diesem Absatz mit einer Aktivität für benannte Entitäten (NER) extrahieren. Dieser Ansatz ist zuverlässiger, als benannte Entitäten aus dem gesamten Dokument zu extrahieren, da Sie den konkreten Bereich steuern können, aus dem diese Entitäten extrahiert werden.
Hinweis: Die Aktivität unterstützt nur Felder des Typs Text, deren Datentyp auf Text, Date oder Money gesetzt ist.

Einrichten einer Aktivität für Benannte Entitäten (NER)

So richten Sie eine Aktivität für Benannte Entitäten (NER) ein:
  1. Fügen Sie auf der Registerkarte Activities eine Aktivität für Benannte Entitäten (NER) zum Dokumentverarbeitungsfluss hinzu.
  2. Verwenden Sie im Bereich Activity Properties die Dropdownliste Source, um die Quelle auszuwählen, aus der die Aktivität benannte Entitäten extrahieren soll — entweder das gesamte Dokument oder ein einzelnes Feld, das von einer anderen Aktivität extrahiert wurde.
  3. Wählen Sie im Output field die Felder aus, in die die benannten Entitäten extrahiert werden sollen.
Hinweis: Die Ausgabefelder müssen sich entweder auf derselben Verschachtelungsebene wie das Quellfeld befinden oder eine Ebene darunter.
  1. Klicken Sie auf Create Mapping. Wählen Sie im daraufhin geöffneten Dialog in der Liste Entity to extract aus, welche benannten Entitäten in jedes Feld extrahiert werden. Klicken Sie auf Save. Sie können die Zuordnung jederzeit bearbeiten, indem Sie auf Edit Mapping klicken.
  2. Klicken Sie auf Test Skill, um Ihr Skill zu testen und die Ergebnisse der Extraktion benannter Entitäten auf der Registerkarte Results zu analysieren.

Unterstützte benannte Entitäten

EntitätsnameBeschreibungBeispielUnterstützte DatentypenUnterstützte Sprachen
PersonPersonennamenJohn Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
LocationOrtsnamenAnytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrganizationOrganisationsnamenABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
AddressAdressen123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
MoneyGeldbeträge$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DateDatumsangabenNovember 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DurationZeitspannenTwelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch