Une Compétence de document extrait les valeurs des champs de documents structurés et semi-structurés d’un seul type. Les documents d’un même type partagent les mêmes champs, les règles de validation et la même structure — par exemple, les factures, les contrats et les listes d’expédition correspondent chacun à un type de document distinct.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Une Compétence de document ne traite qu’un seul fichier par transaction. Pour traiter plusieurs fichiers dans une même transaction, utilisez l’activité Extract d’une Compétence de processus.
Documents structurés et semi-structurés
| Type | Emplacement du champ | Exemples | Où les créer |
|---|---|---|---|
| Structuré | Fixe dans chaque instance | Questionnaires, formulaires de demande, formulaires fiscaux | Vantage. Utilisez Advanced Designer lorsque vous devez combiner le traitement des documents structurés avec d’autres technologies Vantage. |
| Semi-structuré | L’étiquetage, le nombre et l’emplacement varient selon l’instance | Factures, contrats, listes d’expédition | Vantage ou Advanced Designer. |
Entraînement d’une Compétence de document
Variantes de type de document
Choisir une activité en fonction du volume
| Variantes dans votre jeu de documents | Approche recommandée | Précision attendue |
|---|---|---|
| Centaines | Online learning dans Vantage | Extraction quasi parfaite |
| Milliers | Activité Deep Learning | ~80–90 %, selon la complexité du document |
| Un sous-ensemble des variantes essentielles | Activités Fast Learning et/ou Extraction Rules | Précision élevée sur les documents complexes |
Les activités Deep Learning, Fast Learning et Extraction Rules sont disponibles uniquement dans Advanced Designer. Pour les utiliser, ouvrez votre Compétence de document dans Advanced Designer — une fois publiée, la compétence peut toujours être référencée depuis Skill Designer et les Compétences de processus.
Recommandations pour l’entraînement et les tests
- Utilisez un jeu d’entraînement représentatif. Incluez au moins 2 à 3 documents par variante. Même un seul exemple par variante vaut mieux que rien. Si le jeu ne couvre pas toutes les variantes, utilisez l’activité Deep Learning : elle généralise à partir des motifs d’image, de la structure spatiale, du contenu des champs et des libellés environnants, et peut traiter des variantes sur lesquelles elle n’a pas été entraînée.
- Testez avec des distributions proches de la production. Utilisez un échantillon aléatoire issu de votre flux réel de documents afin que chaque variante apparaisse dans le jeu de test à peu près aussi ხშირად que dans l’environnement de production. Cela permet de conserver une estimation valide de l’accuracy.
Prochaines étapes
Configurer une Compétence de document
Créez, entraînez et publiez une Compétence de document, y compris pour les formulaires structurés et l’Online Learning.
Ajout de champs
Marquez les champs dans l’onglet Editor et configurez les propriétés des champs en fonction du type.
Annotation des documents
Consignes d’annotation des documents structurés et semi-structurés pendant l’entraînement.
Analyser les données extraites
Consultez les statistiques d’extraction des champs et corrigez les annotations de référence dans l’onglet Result Review.
