Créez, entraînez et publiez une compétence de document — y compris des compétences structurées (à format fixe), les langues de reconnaissance et Online learning.
Use this file to discover all available pages before exploring further.
Après avoir créé une compétence de document, suivez ces étapes pour l’entraîner et la publier.
Pour ouvrir les paramètres d’une compétence de document, cliquez sur l’icône des paramètres à droite du nom de la compétence dans le Skill Designer.
1
Téléverser des documents d’entraînement et de test
Accédez à l’onglet Documents dans le Skill Designer et cliquez sur Téléverser des documents — au centre du concepteur, dans la barre d’outils ou dans le volet Actions. Chaque fichier doit contenir une seule image de document.
Pendant le téléversement des documents, un indicateur de progression apparaît en haut du Skill Designer (à droite des signets). Pour afficher l’aperçu d’un document, cliquez sur l’icône à gauche de son nom ; faites glisser la bordure gauche de la fenêtre d’aperçu pour la redimensionner jusqu’à 80 % de la largeur du navigateur.
2
Annoter les champs dans vos documents d’entraînement
Accédez à l’onglet Éditeur — soit en cliquant sur le nom de l’onglet, soit en sélectionnant un ou plusieurs documents dans la liste, puis en cliquant sur Annoter les champs et créer des règles métier dans le volet Actions. Annotez chaque champ que vous souhaitez extraire. Vous pouvez également y ajouter des règles de validation et des paramètres de compétence.
3
Entraîner la compétence et vérifier la précision
Cliquez sur Entraîner dans le volet Actions. Une fois l’entraînement terminé, le bouton Entraîner affiche Terminé. Pour arrêter l’entraînement, cliquez sur Cancel sous le bouton Entraîner. Vérifiez la précision de l’extraction et corrigez les erreurs éventuelles.
4
Répéter
Répétez les étapes précédentes jusqu’à ce que les résultats vous conviennent.
5
Publier dans le Skill Catalog
Publiez votre compétence dans le Skill Catalog pour la rendre disponible.
6
(Facultatif) Créer une compétence dérivée
Vous pouvez créer de nouvelles compétences dérivées à partir de votre compétence publiée. Les compétences dérivées héritent de toutes les règles et de tous les champs de leur Skill de base, et peuvent être mises à jour en toute transparence vers la dernière version de base tout en conservant vos modifications.
ABBYY Vantage propose un mode d’apprentissage automatique pour traiter les documents structurés, c’est-à-dire des documents dont l’emplacement des champs est identique d’un exemplaire à l’autre. Les questionnaires, les formulaires de demande et les déclarations fiscales en sont des exemples. Ce mode prend en charge les formulaires comportant plusieurs variantes, comme le Form 1040 de l’IRS pour différentes années, où l’ensemble et l’emplacement des champs varient légèrement selon la variante. Chaque variante constitue un document structuré distinct, et vous devez téléverser un formulaire vierge pour chacune d’elles.
1
Activer les documents à formulaire fixe
Créez une nouvelle compétence de document et activez le bouton bascule Documents à formulaire fixe.
2
Téléverser un formulaire vierge pour chaque variante
Accédez à l’onglet Formulaire vierge et cliquez sur Téléverser un formulaire vierge — au centre du concepteur, dans la barre d’outils ou dans le volet Actions. Si vous n’avez pas de formulaire vierge, téléversez un formulaire rempli et marquez-le comme formulaire vierge.Une compétence peut prendre en charge jusqu’à 10 variantes d’un même formulaire (par exemple, le Form 1040 de l’IRS pour différentes années).
3
Annoter les champs
Annotez les champs que vous souhaitez extraire.
4
Éliminer l’arrière-plan du champ (si nécessaire)
Dans les paramètres du champ, activez Éliminer l’arrière-plan du champ pour les champs dont l’arrière-plan peut affecter la reconnaissance.
5
Entraîner la compétence
Dans le volet Actions, cliquez sur Entraîner.
6
Tester avec des documents remplis
Cliquez sur l’onglet Jeu de test et téléversez des documents de test remplis. Vérifiez que tous les champs sont correctement annotés sur chaque document. Si l’emplacement de certains champs ne correspond à aucun formulaire vierge téléversé, ajoutez un formulaire vierge pour cette variante.
7
Examiner les résultats du test
Dans le volet Actions, testez votre compétence. Une fois l’opération terminée, examinez les résultats. Si ceux-ci ne vous satisfont pas, ajustez l’annotation et entraînez de nouveau la compétence.
8
Publier dans le Skill Catalog
Publiez votre compétence dans le Skill Catalog afin de la rendre disponible à l’utilisation.
Si vous modifiez votre compétence dans Advanced Designer et combinez l’activité Forms avec d’autres activités, le bouton bascule Documents à formulaire fixe est désactivé dans Vantage et la compétence ne peut plus être modifiée en dehors d’Advanced Designer.
Lors du traitement de documents structurés, Vantage peut gérer les tableaux et les groupes répétitifs si :
Le nombre maximal de lignes du tableau ou d’instances du groupe est connu à l’avance.
Les limites du tableau ou du groupe sont fixes.
Annotez chaque ligne susceptible d’apparaître dans les différentes variantes du formulaire. Seules les lignes contenant des données apparaissent dans les résultats du traitement ; les lignes vides sont ignorées.
Seuls les tableaux contenant des valeurs textuelles sont pris en charge. Si votre tableau comporte des colonnes avec des cases à cocher ou des code-barres, utilisez plutôt un groupe répétitif.
Lors du traitement d’un document, Vantage sélectionne une langue de traitement dans la liste des langues activées pour la compétence. Par défaut, les nouvelles compétences ont l’anglais, le français, l’allemand et l’espagnol activés.Pour modifier la liste :
Ouvrez les paramètres de la compétence de document.
Sélectionnez les langues dont vous avez besoin. La liste est triée par ordre alphabétique et les langues actuellement sélectionnées sont affichées en haut. Au moins une langue doit être sélectionnée.
Cliquez sur Enregistrer pour conserver vos modifications, ou sur Annuler pour les ignorer.
Le nombre de langues sélectionnées peut affecter la vitesse de traitement des documents. Limitez la liste aux langues que vous vous attendez réellement à trouver dans vos documents.
Vous pouvez modifier les langues de reconnaissance une fois la compétence entraînée. Pour appliquer cette modification, téléversez de nouveau les documents et réentraînez la compétence.
Online learning collecte les documents traités dans un jeu d’entraînement et poursuit l’entraînement de la compétence à partir de ces documents. Cette fonctionnalité est disponible pour les Compétences de document et les compétences de classification.Les compétences de document prennent en charge deux modes d’Online learning :
Mode
Comportement
Collect and learn
Par défaut. Les documents sont collectés et la compétence est réentraînée automatiquement.
Collect only
Les documents sont collectés, mais la compétence n’est pas réentraînée. Utilisez ce mode pour passer en revue les documents ajoutés au jeu d’entraînement avant de relancer manuellement l’entraînement.
Pour utiliser Collect only, ouvrez les paramètres de la Compétence de document et sélectionnez ce mode.
Pour activer ou désactiver Online learning pour une compétence, voir Activer Online learning.