Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Die Aktivität für Benannte Entitäten (NER) ist dafür ausgelegt, Natural Language Processing (NLP) zu nutzen, um benannte Entitäten aus unstrukturierten Dokumenten zu extrahieren, etwa aus Verträgen, Briefen, Bestellungen, Pressemitteilungen und anderen Dokumenten ohne spezifische Struktur, die sich nicht durch Regeln beschreiben lässt. Um diese Dokumente mit einer Aktivität für Benannte Entitäten (NER) zu verarbeiten, müssen Sie die benannten Entitäten den Skill-Feldern zuordnen, in die die Entitätswerte extrahiert werden. Diese Aktivität analysiert anschließend das Dokument und extrahiert die benannten Entitäten in die entsprechenden Felder. Sie können die Extraktion benannter Entitäten auch für Felder einrichten, die von anderen Aktivitäten extrahiert wurden. Angenommen, Sie wissen, dass die zu extrahierenden Organisationsnamen und Adressen im ersten Absatz jedes Vertrags stehen. Sie können den ersten Absatz mithilfe einer Segmentation-Aktivität extrahieren und anschließend Unternehmensnamen und Adressen aus diesem Absatz mit einer Aktivität für Benannte Entitäten (NER) extrahieren. Dieser Ansatz ist zuverlässiger, als benannte Entitäten aus dem gesamten Dokument zu extrahieren, da Sie den spezifischen Bereich steuern können, aus dem diese Entitäten extrahiert werden.
Die Aktivität unterstützt nur Felder des Typs Text, deren Datentyp auf Text, Date oder Money gesetzt ist.

Richten Sie eine Aktivität für Benannte Entitäten (NER) ein

1

Fügen Sie die Aktivität hinzu

Fügen Sie auf der Registerkarte Activities eine Aktivität für Benannte Entitäten (NER) zum Dokumentverarbeitungsablauf hinzu.
2

Wählen Sie die Quelle aus

Verwenden Sie im Bereich Activity Properties die Dropdown-Liste Source, um eine Quelle auszuwählen, aus der die Aktivität Named Entities extrahieren soll — entweder aus dem Ganzen Dokument oder aus einem einzelnen Feld, das von einer anderen Aktivität extrahiert wurde.
3

Wählen Sie Ausgabefelder aus

Wählen Sie im Output field die Felder aus, in die die Named Entities extrahiert werden.Die Ausgabefelder müssen sich entweder auf derselben Verschachtelungsebene wie das Quellfeld oder eine Ebene darunter befinden.
4

Erstellen Sie das Mapping

Klicken Sie auf Create Mapping. Wählen Sie im daraufhin geöffneten Dialogfeld in der Liste Entity to extract aus, welche Named Entities in die einzelnen Felder extrahiert werden. Klicken Sie auf Save. Sie können das Mapping jederzeit bearbeiten, indem Sie auf Edit Mapping klicken.
5

Testen Sie den Skill

Klicken Sie auf Test Skill, um den Skill auszuführen und die Ergebnisse der Named-Entity-Extraktion auf der Registerkarte Results zu prüfen.

Unterstützte benannte Entitäten

EntitätsnameBeschreibungBeispielUnterstützte DatentypenUnterstützte Sprachen
PersonPersonennamenJohn Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrtOrtsnamenAnytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrganisationOrganisationsnamenABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
AdresseAdressen123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
MoneyGeldbeträge$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DatumDatumsangabenNovember 14, 2009, 11/14/2009Text, DatumEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DauerZeitspannenTwelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch