Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Une Compétence de document extrait les valeurs des champs de documents structurés et semi-structurés d’un seul type. Les documents d’un même type partagent les mêmes champs, les règles de validation et la même structure — par exemple, les factures, les contrats et les listes d’expédition correspondent chacun à un type de document distinct.
Une Compétence de document ne traite qu’un seul fichier par transaction. Pour traiter plusieurs fichiers dans une même transaction, utilisez l’activité Extract d’une Compétence de processus.

Documents structurés et semi-structurés

TypeEmplacement du champExemplesOù les créer
StructuréFixe dans chaque instanceQuestionnaires, formulaires de demande, formulaires fiscauxVantage. Utilisez Advanced Designer lorsque vous devez combiner le traitement des documents structurés avec d’autres technologies Vantage.
Semi-structuréL’étiquetage, le nombre et l’emplacement varient selon l’instanceFactures, contrats, listes d’expéditionVantage ou Advanced Designer.

Entraînement d’une Compétence de document

Pour commencer l’entraînement d’une Compétence de document, annotez les champs sur un document. Pendant l’entraînement, Vantage suggère automatiquement l’emplacement des champs afin d’accélérer le processus d’annotation.

Variantes de type de document

Les documents d’un même type présentent presque toujours des champs, des règles de validation et une structure identiques, mais les variantes d’un même type peuvent différer légèrement — par exemple, en fonction de l’année de délivrance du document. Une seule Compétence de document peut gérer un nombre quelconque de variantes ; l’approche d’entraînement appropriée dépend du nombre de variantes que vous devez couvrir.

Choisir une activité en fonction du volume

Pour les formulaires structurés (jusqu’à 10 variantes), utilisez la Compétence de document Vantage. Traitez les variantes supplémentaires comme des types de documents distincts. Pour les documents semi-structurés, l’approche recommandée dépend du nombre de variantes :
Variantes dans votre jeu de documentsApproche recommandéePrécision attendue
CentainesOnline learning dans VantageExtraction quasi parfaite
MilliersActivité Deep Learning~80–90 %, selon la complexité du document
Un sous-ensemble des variantes essentiellesActivités Fast Learning et/ou Extraction RulesPrécision élevée sur les documents complexes
Les activités Deep Learning, Fast Learning et Extraction Rules sont disponibles uniquement dans Advanced Designer. Pour les utiliser, ouvrez votre Compétence de document dans Advanced Designer — une fois publiée, la compétence peut toujours être référencée depuis Skill Designer et les Compétences de processus.

Recommandations pour l’entraînement et les tests

  • Utilisez un jeu d’entraînement représentatif. Incluez au moins 2 à 3 documents par variante. Même un seul exemple par variante vaut mieux que rien. Si le jeu ne couvre pas toutes les variantes, utilisez l’activité Deep Learning : elle généralise à partir des motifs d’image, de la structure spatiale, du contenu des champs et des libellés environnants, et peut traiter des variantes sur lesquelles elle n’a pas été entraînée.
  • Testez avec des distributions proches de la production. Utilisez un échantillon aléatoire issu de votre flux réel de documents afin que chaque variante apparaisse dans le jeu de test à peu près aussi ხშირად que dans l’environnement de production. Cela permet de conserver une estimation valide de l’accuracy.

Prochaines étapes

Configurer une Compétence de document

Créez, entraînez et publiez une Compétence de document, y compris pour les formulaires structurés et l’Online Learning.

Ajout de champs

Marquez les champs dans l’onglet Editor et configurez les propriétés des champs en fonction du type.

Annotation des documents

Consignes d’annotation des documents structurés et semi-structurés pendant l’entraînement.

Analyser les données extraites

Consultez les statistiques d’extraction des champs et corrigez les annotations de référence dans l’onglet Result Review.