Un ensemble de documents « mixte » peut désigner deux choses dans Advanced Designer :Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Un même ensemble qui contient à la fois des documents semi-structurés et non structurés (différents types de documents).
- Un seul document qui présente une structure mixte — par exemple, un contrat non structuré avec des tableaux intégrés, des titres, des en-têtes ou des pieds de page.
Choisissez un scénario
| Scénario | Quand l’utiliser | Activités clés |
|---|---|---|
| Documents semi-structurés et non structurés dans un même ensemble | Les deux relèvent d’un même type logique avec des champs de sortie communs | Classify + IF + Fast Learning + Segmentation + Deep Learning for NLP |
| Cellules de tableau contenant des champs | Extraire des valeurs à l’intérieur de cellules de tableau (p. ex., des noms dans un Closing Disclosure) | Fast Learning + NER (+ Address Parsing) |
| Documents non structurés avec tableaux/titres/en-têtes/pieds de page intégrés | Principalement des documents non structurés avec des fragments semi-structurés | Segmentation + Extraction Rules |
Workflow type
Créer une compétence de document
Ouvrez Advanced Designer et cliquez sur Créer une compétence de document dans la page d’accueil.
Téléverser des documents
Dans l’onglet Documents, téléversez les documents que vous utiliserez pour configurer la compétence.
Définir les champs et étiqueter les documents
Dans l’onglet Fields, créez et configurez les champs que la compétence extraira. Étiquetez les documents dans la section Reference.
Ajouter et configurer des activités
Dans l’onglet Activities, ajoutez les activités adaptées à votre scénario (décrit ci-dessous). Ouvrez chaque activité dans l’Éditeur d’activité pour la configurer et l’entraîner.
Tester et publier
Cliquez sur Test Skill Using Selected Documents pour évaluer les résultats. Lorsque ceux-ci sont suffisamment bons, publier la compétence.
Documents semi-structurés et non structurés dans un même ensemble
- Traitez les documents semi-structurés avec une activité Fast Learning.
- Traitez les documents non structurés avec une activité Segmentation, suivie d’une activité Deep Learning for NLP.

Cellules de tableau avec des champs intégrés au texte de la cellule
- activité Named Entities (NER) pour les entités telles que les noms et les organisations.
- activité Address Parsing pour décomposer les adresses en éléments.


Classify By Text and Image
Classer les documents en combinant des caractéristiques textuelles et visuelles.
Activité Fast Learning
Extraire des champs de documents semi-structurés et de cellules de tableau.
Activité Segmentation
Isoler les paragraphes contenant des champs non structurés.
Activité Deep Learning for NLP
Extraire des entités personnalisées ou difficiles à distinguer dans du texte non structuré.
Activité Named Entities (NER)
Extraire des entités préentraînées comme des noms, des organisations et des dates.
Activité Extraction Rules
Définir une extraction fondée sur des règles pour des fragments semi-structurés.
