Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Utilisez Advanced Designer pour les ensembles de documents semi-structurés trop complexes pour être traités uniquement avec le Skill Designer cloud — par exemple, des ensembles comportant de nombreuses mises en page variables, des cas atypiques nécessitant une extraction basée sur des règles, ou des données d’entraînement insuffisantes pour l’apprentissage automatique.

Choisissez un scénario

ScénarioQuand l’utiliserActivités clés
Nombreuses variantes de documentsDe nouveaux modèles continuent d’apparaîtreDeep Learning + Fast Learning
Cas atypiques nécessitant des règlesLa plupart des variantes fonctionnent avec le machine learning, mais certaines nécessitent des règlesClassify + IF + Deep Learning + Extraction Rules
Données d’entraînement limitéesPas assez de documents pour entraîner Deep LearningClassify + Extraction Rules par variante
Chaque scénario ci-dessous suit le même schéma ; seules les activités que vous ajoutez au flux de traitement diffèrent.

Workflow type

1

Créer une compétence de document

Ouvrez Advanced Designer et cliquez sur Create Document Skill dans la page d’accueil.
2

Téléverser des documents

Dans l’onglet Documents, téléversez les documents que vous utiliserez pour configurer la compétence. Pour les scénarios qui incluent une classification, ajoutez un nombre à peu près égal de documents pour chaque variante afin que le classificateur dispose de données d’entraînement équilibrées.
3

Définir les champs et étiqueter les documents

Dans l’onglet Fields, créez et configurez les champs que la compétence extraira. Étiquetez les documents dans la section Reference.
4

Ajouter et configurer des activités

Dans l’onglet Activities, ajoutez les activités correspondant à votre scénario (décrit ci-dessous). Ouvrez chaque activité dans l’Éditeur d’activité pour la configurer et l’entraîner.
5

Tester et publier

Cliquez sur Test Skill Using Selected Documents pour évaluer les résultats. Lorsque les résultats sont satisfaisants, publiez la compétence.

De nombreuses variantes de documents

Utilisez ce scénario lorsque les documents sont du même type, mais que leurs mises en page varient fortement — par exemple, des factures provenant de nombreux fournisseurs, avec de nouveaux modèles qui continuent d’apparaître. Associez une activité Deep Learning à une activité Fast Learning :
  • Deep Learning permet de généraliser à des variantes inédites. L’entraînement nécessite au moins 100 documents annotés.
  • Fast Learning améliore la précision sur les modèles spécifiques que vous avez déjà rencontrés. Il peut également être entraîné en continu via la boucle de rétroaction Online Learning issue de la relecture manuelle.
Flux de traitement des documents avec Deep Learning suivi de Fast Learning

Cas atypiques nécessitant une extraction basée sur des règles

Utilisez ce scénario lorsque la plupart des variantes sont correctement traitées avec Deep Learning + Fast Learning, mais que quelques documents contiennent des tableaux imbriqués ou d’autres éléments que l’apprentissage automatique ne capturera pas clairement. Séparez les cas atypiques à l’aide d’une Classify activity, puis créez un branchement dans le flux avec une activité IF :
  • Utilisez Classify By Company lorsque les variantes proviennent de différentes entreprises dont le nom ou l’adresse apparaît sur le document — par exemple, des relevés bancaires de plusieurs banques.
  • Utilisez Classify By Text and Image dans tous les autres cas. Ce classificateur multimodal utilise des motifs textuels, de mise en page et d’image pour distinguer les variantes.
Après le branchement, faites passer les documents atypiques par une activité Extraction Rules adaptée à ces documents.
Flux de traitement des documents avec les activités Classify, IF, Deep Learning et Extraction Rules

Données d’entraînement limitées

Utilisez ce scénario lorsque vous n’avez pas suffisamment de documents pour entraîner une activité Deep Learning, mais que vous avez une connaissance suffisante du domaine pour décrire les règles d’extraction — par exemple, des formulaires fiscaux qui varient selon l’année. Répartissez les documents à l’aide d’une Classify activity (Classify By Company ou Classify By Text and Image), puis dirigez chaque variante vers sa propre activité Extraction Rules. Ajoutez éventuellement une activité Fast Learning afin que Vantage puisse affiner la compétence au fil du temps.
Flux de traitement des documents avec une Classify activity se divisant en plusieurs activités Extraction Rules

Activité Deep Learning

Prenez en charge de nombreuses mises en page semi-structurées.

Activité Fast Learning

Affinez la précision sur des modèles connus grâce aux retours de la relecture manuelle.

Activité Extraction Rules

Définissez une extraction basée sur des règles pour les cas atypiques ou les jeux de données réduits.

Activités Classify

Acheminez le flux selon la variante du document avant l’extraction.