L’activité d’entités nommées (NER) est conçue pour utiliser le traitement du langage naturel (NLP) afin d’extraire des entités nommées depuis des documents non structurés, tels que des contrats, des lettres, des commandes, des communiqués de presse et d’autres documents sans structure spécifique pouvant être décrite par des règles. Pour traiter ces documents à l’aide d’une activité d’entités nommées (NER), vous devez faire correspondre les entités nommées aux champs de la compétence dans lesquels les valeurs des entités seront extraites. Cette activité analysera ensuite le document et extraira les entités nommées dans leurs champs correspondants. Vous pouvez également configurer l’extraction d’entités nommées pour des champs extraits par d’autres activités. Supposons que vous sachiez que les noms d’organisation et les adresses à extraire se trouvent dans le premier paragraphe de chaque contrat. Vous pouvez extraire ce premier paragraphe à l’aide d’une activité Segmentation, puis en extraire les noms d’entreprise et les adresses à l’aide d’une activité d’entités nommées (NER). Cette approche est plus fiable que l’extraction d’entités nommées sur l’ensemble du document, car vous pouvez contrôler précisément la zone d’où ces entités sont extraites.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
L’activité prend uniquement en charge les champs de type Text dont le type de données est défini sur Text, Date ou Money.
Configurer une activité Named Entities (NER)
Ajouter l’activité
Dans l’onglet Activities, ajoutez une activité Named Entities (NER) au flux de traitement des documents.
Sélectionner la source
Dans le volet Activity Properties, utilisez la liste déroulante Source pour sélectionner la source que l’activité utilisera pour extraire les entités nommées : soit l’ensemble du document, soit un champ unique extrait par une autre activité.
Sélectionner les champs de sortie
Dans Output field, sélectionnez les champs dans lesquels les entités nommées seront extraites.Les champs de sortie doivent se trouver soit au même niveau d’imbrication que le champ source, soit un niveau en dessous.
Créer le mappage
Cliquez sur Create Mapping. Dans la boîte de dialogue qui s’ouvre, sélectionnez, pour chaque champ, les entités nommées à extraire dans la liste Entity to extract. Cliquez sur Save. Vous pouvez modifier le mappage à tout moment en cliquant sur Edit Mapping.
Entités nommées prises en charge
| Nom de l’entité | Description | Exemple | Types de données pris en charge | Langues prises en charge |
|---|---|---|---|---|
| personne | Noms de personnes | John Doe, Jane Smith | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| lieu | Noms de lieux | Anytown, Corporate Place | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| organisation | Noms d’organisations | ABBYY, Acme Corp. | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| adresse | Adresses | 123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USA | Text | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| montant | Montants d’argent | $2670.00, 199 dollars 99 cents | Text, Amount of money | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Date | Dates | November 14, 2009, 11/14/2009 | Text, Date | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| durée | Durées | Twelve (12) months, 4 days | Text | English, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch |
