Traiter des documents structurés dans Advanced Designer
Créez des compétences de document pour les documents structurés — Skill Designer couvre le cas de base ; Advanced Designer combine Forms avec d’autres activités.
Use this file to discover all available pages before exploring further.
Un document structuré a une mise en page fixe : les champs apparaissent au même endroit sur chaque exemplaire. Parmi les exemples courants figurent les questionnaires, les formulaires de candidature et les déclarations fiscales. Certains documents structurés présentent un petit nombre de variantes avec de légères différences dans la position des champs. Pour en savoir plus, voir Extraire des données de documents dans Advanced Designer.
Vous pouvez créer des compétences pour les documents structurés dans Skill Designer ou Advanced Designer, mais vous ne pouvez les modifier que dans Advanced Designer.
Advanced Designer (Windows desktop) — utilisez-le si vous devez combiner l’activité Forms avec d’autres activités Vantage (voir les scénarios ci-dessous).
Si vous n’activez pas le bouton bascule Fixed-form documents dans Skill Designer, le flux de traitement de la compétence contient uniquement une activité Fast Learning.
Une fois que le flux d’une compétence inclut une activité Forms avec d’autres activités, ou plusieurs activités Forms, vous ne pouvez modifier les propriétés de la compétence que depuis Vantage ; l’entraînement et les modifications plus avancées doivent être effectués dans Advanced Designer.
Certains documents structurés comportent des éléments non structurés, tels que des code-barres ou des tampons placés n’importe où sur la page, ou des tableaux à longueur variable en plus d’une structure fixe. Pour les traiter, associez une activité Forms à une activité Extraction Rules — Forms gère les champs structurés, tandis qu’Extraction Rules gère les éléments non structurés (par exemple, les code-barres).
1
Créer une compétence de document
Ouvrez Advanced Designer et cliquez sur Create Document Skill dans la page d’accueil.
2
Ajouter et entraîner une activité Forms
Dans l’onglet Activities, ajoutez une activité Forms. Dans l’Éditeur d’activité, sur l’onglet Blank Form, téléversez un exemple de formulaire vierge par variante (il est recommandé de ne pas dépasser dix variantes) et annotez les champs que vous souhaitez extraire. Consultez les consignes d’annotation. Cliquez sur Train Activity.
3
Tester la activité Forms
Ouvrez l’onglet Test Set, téléversez les documents de test remplis, vérifiez que les champs sont correctement annotés, puis cliquez sur Test Activity. Examinez les résultats.
4
Ajouter et configurer une activité Extraction Rules
Revenez à l’onglet Activities, ajoutez une activité Extraction Rules et configurez-la dans l’Éditeur d’activité.
5
Tester et publier
Cliquez sur Test Skill Using Selected Documents. Si les résultats sont satisfaisants, publier la compétence. Sinon, ajustez l’annotation, entraînez de nouveau, puis refaites le test.
Tableaux et groupes répétitifs. Les activités Forms peuvent extraire des tableaux et des groupes répétitifs uniquement lorsque le nombre maximal de lignes ou d’instances est connu à l’avance et que les limites sont fixes. Annotez chaque ligne susceptible d’apparaître dans toutes les variantes du formulaire — seules les lignes contenant des données sont renvoyées dans les résultats. Actuellement, les tableaux Forms prennent en charge uniquement les valeurs textuelles ; pour les colonnes contenant des cases à cocher ou des code-barres, utilisez plutôt un groupe répétitif. Si le nombre de lignes n’est pas connu à l’avance, utilisez une autre technologie Vantage.
Certains workflows reçoivent les mêmes informations soit sur un formulaire imprimé, soit dans un document de forme libre — par exemple, des questionnaires renvoyés à la fois sous forme de formulaires remplis et de texte libre non structuré. Combinez une activité Forms avec une Fast Learning (ou Extraction Rules), et acheminez les documents vers le bon chemin à l’aide d’une activité Classify et d’une activité IF.
1
Créer une compétence de document
Ouvrez Advanced Designer et cliquez sur Create Document Skill dans la page d’accueil.
2
Ajouter et entraîner une activité Forms
Dans l’onglet Activities, ajoutez une activité Forms. Dans l’Éditeur d’activité, sous l’onglet Blank Form, téléversez un exemple de formulaire vierge et annotez ses champs. Consultez les consignes d’annotation. Cliquez sur Train Activity.
3
Tester la activité Forms
Ouvrez l’onglet Test Set, téléversez des documents de test remplis, vérifiez l’annotation des champs, puis cliquez sur Test Activity. Examinez les résultats.
4
Ajouter et entraîner une activité Fast Learning
Dans l’onglet Activities, ajoutez une Fast Learning activity et configurez-la, puis entraînez-la dans l’Éditeur d’activité.
5
Ajouter une activité Classify au début
Ajoutez une activité Classify (Classify By Company ou Classify By Text and Image) au début du flux. Dans l’Éditeur d’activité, créez une classe pour chaque variante de document, assignez des classes à vos documents d’entraînement et entraînez l’activité.
6
Créer des branches dans le flux avec une activité IF
Ajoutez une activité IF, puis connectez ses branches aux activités Forms et Fast Learning afin que chaque type de document soit acheminé vers le bon chemin d’extraction.
7
Tester et publier
Cliquez sur Test Skill Using Selected Documents. Si les résultats sont acceptables, publiez la compétence. Sinon, ajustez l’annotation et réentraînez-la.