Les compétences de traitement de documents non structurés ne peuvent être créées que dans Advanced Designer ; le Skill Designer dans le cloud ne prend pas en charge ces scénarios. Elles s’appuient sur quatre activités NLP principales pour identifier des entités, segmenter le texte et extraire des champs à partir de contenu libre, comme des contrats, des lettres et des e-mails :Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- activité Segmentation
- activité Deep Learning for NLP
- activité Named Entities (NER)
- activité Address Parsing
Chacune de ces activités prend en charge un nombre limité de langues. Consultez la page de référence de l’activité pour voir la liste des langues.
Choisissez un scénario
| Scénario | Quand l’utiliser | Activités clés |
|---|---|---|
| Entités nommées pré-entraînées (document entier) | Les entités peuvent apparaître n’importe où — configuration minimale requise | NER (+ Address Parsing) |
| Entités nommées pré-entraînées (paragraphes spécifiques) | L’entité se trouve toujours dans un paragraphe identifié | Segmentation + NER (ou Address Parsing) |
| Entités nommées personnalisées (Deep Learning for NLP) | Les modèles préentraînés ne peuvent pas lever l’ambiguïté, ou votre type d’entité n’est pas couvert | Segmentation + Deep Learning for NLP |
Workflow type
Créer une compétence de document
Ouvrez Advanced Designer et cliquez sur Create Document Skill sur la page d’accueil.
Téléverser des documents
Dans l’onglet Documents, téléversez les documents que vous utiliserez pour configurer la compétence.
Définir les champs et annoter
Dans l’onglet Fields, créez et configurez les champs que la compétence extraira. Annotez les documents dans la section Reference.
Ajouter et configurer les activités NLP
Dans l’onglet Activities, ajoutez les activités correspondant à votre scénario (décrit ci-dessous). Ouvrez chaque activité dans l’Éditeur d’activité pour la configurer et l’entraîner.
Tester et publier
Cliquez sur Test Skill Using Selected Documents pour évaluer les résultats. Lorsque les résultats sont satisfaisants, publiez la compétence.
Entités nommées pré-entraînées (document entier)

Entités nommées pré-entraînées (paragraphes spécifiques)

Entités nommées personnalisées (Deep Learning for NLP)
L’entraînement d’une activité Deep Learning for NLP nécessite au moins 50 documents (150 recommandés). Pour obtenir les meilleurs résultats, essayez également l’activité pré-entraînée Named Entities (NER) et retenez celle qui offre la meilleure précision sur vos documents.

activité Named Entities (NER)
Extrait des entités préentraînées comme les noms, les organisations et les dates à partir de texte libre.
activité Address Parsing
Décompose les adresses en rue, ville, État, pays et code postal.
activité Segmentation
Isole le paragraphe qui contient les données à extraire.
activité Deep Learning for NLP
Entraîne un réseau neuronal pour extraire des entités personnalisées ou difficiles à distinguer.
