Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

L’activité d’entités nommées (NER) est conçue pour utiliser le traitement du langage naturel (NLP) afin d’extraire des entités nommées depuis des documents non structurés, tels que des contrats, des lettres, des commandes, des communiqués de presse et d’autres documents sans structure spécifique pouvant être décrite par des règles. Pour traiter ces documents à l’aide d’une activité d’entités nommées (NER), vous devez faire correspondre les entités nommées aux champs de la compétence dans lesquels les valeurs des entités seront extraites. Cette activité analysera ensuite le document et extraira les entités nommées dans leurs champs correspondants. Vous pouvez également configurer l’extraction d’entités nommées pour des champs extraits par d’autres activités. Supposons que vous sachiez que les noms d’organisation et les adresses à extraire se trouvent dans le premier paragraphe de chaque contrat. Vous pouvez extraire ce premier paragraphe à l’aide d’une activité Segmentation, puis en extraire les noms d’entreprise et les adresses à l’aide d’une activité d’entités nommées (NER). Cette approche est plus fiable que l’extraction d’entités nommées sur l’ensemble du document, car vous pouvez contrôler précisément la zone d’où ces entités sont extraites.
L’activité prend uniquement en charge les champs de type Text dont le type de données est défini sur Text, Date ou Money.

Configurer une activité Named Entities (NER)

1

Ajouter l’activité

Dans l’onglet Activities, ajoutez une activité Named Entities (NER) au flux de traitement des documents.
2

Sélectionner la source

Dans le volet Activity Properties, utilisez la liste déroulante Source pour sélectionner la source que l’activité utilisera pour extraire les entités nommées : soit l’ensemble du document, soit un champ unique extrait par une autre activité.
3

Sélectionner les champs de sortie

Dans Output field, sélectionnez les champs dans lesquels les entités nommées seront extraites.Les champs de sortie doivent se trouver soit au même niveau d’imbrication que le champ source, soit un niveau en dessous.
4

Créer le mappage

Cliquez sur Create Mapping. Dans la boîte de dialogue qui s’ouvre, sélectionnez, pour chaque champ, les entités nommées à extraire dans la liste Entity to extract. Cliquez sur Save. Vous pouvez modifier le mappage à tout moment en cliquant sur Edit Mapping.
5

Tester la compétence

Cliquez sur Test Skill pour exécuter la compétence et consulter les résultats de l’extraction d’entités nommées dans l’onglet Results.

Entités nommées prises en charge

Nom de l’entitéDescriptionExempleTypes de données pris en chargeLangues prises en charge
personneNoms de personnesJohn Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
lieuNoms de lieuxAnytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
organisationNoms d’organisationsABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
adresseAdresses123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
montantMontants d’argent$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DateDatesNovember 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
duréeDuréesTwelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch