Die Aktivität für Benannte Entitäten (NER) ist dafür ausgelegt, Natural Language Processing (NLP) zu nutzen, um benannte Entitäten aus unstrukturierten Dokumenten zu extrahieren, etwa aus Verträgen, Briefen, Bestellungen, Pressemitteilungen und anderen Dokumenten ohne spezifische Struktur, die sich nicht durch Regeln beschreiben lässt. Um diese Dokumente mit einer Aktivität für Benannte Entitäten (NER) zu verarbeiten, müssen Sie die benannten Entitäten den Skill-Feldern zuordnen, in die die Entitätswerte extrahiert werden. Diese Aktivität analysiert anschließend das Dokument und extrahiert die benannten Entitäten in die entsprechenden Felder. Sie können die Extraktion benannter Entitäten auch für Felder einrichten, die von anderen Aktivitäten extrahiert wurden. Angenommen, Sie wissen, dass die zu extrahierenden Organisationsnamen und Adressen im ersten Absatz jedes Vertrags stehen. Sie können den ersten Absatz mithilfe einer Segmentation-Aktivität extrahieren und anschließend Unternehmensnamen und Adressen aus diesem Absatz mit einer Aktivität für Benannte Entitäten (NER) extrahieren. Dieser Ansatz ist zuverlässiger, als benannte Entitäten aus dem gesamten Dokument zu extrahieren, da Sie den spezifischen Bereich steuern können, aus dem diese Entitäten extrahiert werden.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Die Aktivität unterstützt nur Felder des Typs Text, deren Datentyp auf Text, Date oder Money gesetzt ist.
Richten Sie eine Aktivität für Benannte Entitäten (NER) ein
Fügen Sie die Aktivität hinzu
Fügen Sie auf der Registerkarte Activities eine Aktivität für Benannte Entitäten (NER) zum Dokumentverarbeitungsablauf hinzu.
Wählen Sie die Quelle aus
Verwenden Sie im Bereich Activity Properties die Dropdown-Liste Source, um eine Quelle auszuwählen, aus der die Aktivität Named Entities extrahieren soll — entweder aus dem Ganzen Dokument oder aus einem einzelnen Feld, das von einer anderen Aktivität extrahiert wurde.
Wählen Sie Ausgabefelder aus
Wählen Sie im Output field die Felder aus, in die die Named Entities extrahiert werden.Die Ausgabefelder müssen sich entweder auf derselben Verschachtelungsebene wie das Quellfeld oder eine Ebene darunter befinden.
Erstellen Sie das Mapping
Klicken Sie auf Create Mapping. Wählen Sie im daraufhin geöffneten Dialogfeld in der Liste Entity to extract aus, welche Named Entities in die einzelnen Felder extrahiert werden. Klicken Sie auf Save. Sie können das Mapping jederzeit bearbeiten, indem Sie auf Edit Mapping klicken.
Unterstützte benannte Entitäten
| Entitätsname | Beschreibung | Beispiel | Unterstützte Datentypen | Unterstützte Sprachen |
|---|---|---|---|---|
| Person | Personennamen | John Doe, Jane Smith | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Ort | Ortsnamen | Anytown, Corporate Place | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Organisation | Organisationsnamen | ABBYY, Acme Corp. | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Adresse | Adressen | 123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USA | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Money | Geldbeträge | $2670.00, 199 dollars 99 cents | Text, Amount of money | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Datum | Datumsangaben | November 14, 2009, 11/14/2009 | Text, Datum | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Dauer | Zeitspannen | Twelve (12) months, 4 days | Text | English, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch |
