Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un document structuré a une mise en page fixe : les champs apparaissent au même endroit sur chaque exemplaire. Parmi les exemples courants figurent les questionnaires, les formulaires de candidature et les déclarations fiscales. Certains documents structurés présentent un petit nombre de variantes avec de légères différences dans la position des champs. Pour en savoir plus, voir Extraire des données de documents dans Advanced Designer.
IRS Form 1040 (2020) — exemple de document structuré

Où créer la compétence

Vous pouvez créer des compétences pour les documents structurés dans Skill Designer ou Advanced Designer, mais vous ne pouvez les modifier que dans Advanced Designer.
  • Skill Designer (cloud) — activez le bouton bascule Fixed-form documents pour la compétence, puis téléversez et étiquetez quelques formulaires vierges. Consultez Configuration d’une compétence de document pour le traitement des documents structurés. La compétence obtenue inclut une activité Forms, visible si vous l’ouvrez ensuite dans Advanced Designer.
  • Advanced Designer (Windows desktop) — utilisez-le si vous devez combiner l’activité Forms avec d’autres activités Vantage (voir les scénarios ci-dessous).
Si vous n’activez pas le bouton bascule Fixed-form documents dans Skill Designer, le flux de traitement de la compétence contient uniquement une activité Fast Learning.
Une fois que le flux d’une compétence inclut une activité Forms avec d’autres activités, ou plusieurs activités Forms, vous ne pouvez modifier les propriétés de la compétence que depuis Vantage ; l’entraînement et les modifications plus avancées doivent être effectués dans Advanced Designer.

Sélectionnez un scénario

ScénarioQuand l’utiliserActivités clés
Formulaires avec des éléments non structurésLes formulaires contiennent aussi des code-barres, des tampons ou des tableaux à longueur variableForms + Extraction Rules
Mélange de formulaires et de documents non structurésLes mêmes données arrivent soit sous forme de formulaires, soit sous forme de texte libreClassify + IF + Forms + Fast Learning

Formulaires avec des éléments non structurés

Certains documents structurés comportent des éléments non structurés, tels que des code-barres ou des tampons placés n’importe où sur la page, ou des tableaux à longueur variable en plus d’une structure fixe. Pour les traiter, associez une activité Forms à une activité Extraction Rules — Forms gère les champs structurés, tandis qu’Extraction Rules gère les éléments non structurés (par exemple, les code-barres).
1

Créer une compétence de document

Ouvrez Advanced Designer et cliquez sur Create Document Skill dans la page d’accueil.
2

Ajouter et entraîner une activité Forms

Dans l’onglet Activities, ajoutez une activité Forms. Dans l’Éditeur d’activité, sur l’onglet Blank Form, téléversez un exemple de formulaire vierge par variante (il est recommandé de ne pas dépasser dix variantes) et annotez les champs que vous souhaitez extraire. Consultez les consignes d’annotation. Cliquez sur Train Activity.
3

Tester la activité Forms

Ouvrez l’onglet Test Set, téléversez les documents de test remplis, vérifiez que les champs sont correctement annotés, puis cliquez sur Test Activity. Examinez les résultats.
4

Ajouter et configurer une activité Extraction Rules

Revenez à l’onglet Activities, ajoutez une activité Extraction Rules et configurez-la dans l’Éditeur d’activité.
5

Tester et publier

Cliquez sur Test Skill Using Selected Documents. Si les résultats sont satisfaisants, publier la compétence. Sinon, ajustez l’annotation, entraînez de nouveau, puis refaites le test.
Tableaux et groupes répétitifs. Les activités Forms peuvent extraire des tableaux et des groupes répétitifs uniquement lorsque le nombre maximal de lignes ou d’instances est connu à l’avance et que les limites sont fixes. Annotez chaque ligne susceptible d’apparaître dans toutes les variantes du formulaire — seules les lignes contenant des données sont renvoyées dans les résultats. Actuellement, les tableaux Forms prennent en charge uniquement les valeurs textuelles ; pour les colonnes contenant des cases à cocher ou des code-barres, utilisez plutôt un groupe répétitif. Si le nombre de lignes n’est pas connu à l’avance, utilisez une autre technologie Vantage.

Formulaires mixtes et documents non structurés

Certains workflows reçoivent les mêmes informations soit sur un formulaire imprimé, soit dans un document de forme libre — par exemple, des questionnaires renvoyés à la fois sous forme de formulaires remplis et de texte libre non structuré. Combinez une activité Forms avec une Fast Learning (ou Extraction Rules), et acheminez les documents vers le bon chemin à l’aide d’une activité Classify et d’une activité IF.
1

Créer une compétence de document

Ouvrez Advanced Designer et cliquez sur Create Document Skill dans la page d’accueil.
2

Ajouter et entraîner une activité Forms

Dans l’onglet Activities, ajoutez une activité Forms. Dans l’Éditeur d’activité, sous l’onglet Blank Form, téléversez un exemple de formulaire vierge et annotez ses champs. Consultez les consignes d’annotation. Cliquez sur Train Activity.
3

Tester la activité Forms

Ouvrez l’onglet Test Set, téléversez des documents de test remplis, vérifiez l’annotation des champs, puis cliquez sur Test Activity. Examinez les résultats.
4

Ajouter et entraîner une activité Fast Learning

Dans l’onglet Activities, ajoutez une Fast Learning activity et configurez-la, puis entraînez-la dans l’Éditeur d’activité.
5

Ajouter une activité Classify au début

Ajoutez une activité Classify (Classify By Company ou Classify By Text and Image) au début du flux. Dans l’Éditeur d’activité, créez une classe pour chaque variante de document, assignez des classes à vos documents d’entraînement et entraînez l’activité.
6

Créer des branches dans le flux avec une activité IF

Ajoutez une activité IF, puis connectez ses branches aux activités Forms et Fast Learning afin que chaque type de document soit acheminé vers le bon chemin d’extraction.
7

Tester et publier

Cliquez sur Test Skill Using Selected Documents. Si les résultats sont acceptables, publiez la compétence. Sinon, ajustez l’annotation et réentraînez-la.

Activité Forms

Extraire des champs de documents à mise en page fixe.

Activité Extraction Rules

Définir une extraction basée sur des règles pour des éléments non structurés comme les code-barres.

Activité Fast Learning

Affiner l’extraction sur des documents à structure libre à l’aide des retours de la relecture manuelle.

Activités Classify

Orienter un flux selon la variante de document avant l’extraction.