Passer au contenu principal
Les documents que nous allons traiter peuvent être répartis en deux classes en fonction de leur mise en page. Nous souhaitons créer un ensemble distinct de règles d’extraction pour chaque classe. Nous voulons également que notre compétence puisse être entraînée à l’aide des technologies standard de Vantage. Configurons le flux de traitement des documents de la compétence conformément à ces exigences.
  1. Accédez à l’onglet Activities.
  2. Tout d’abord, nous devons déterminer la classe du document. Pour ce faire, nous allons utiliser une activité de classification. Cliquez sur l’activité Classify By Text and Image dans le panneau Activities. Elle sera ajoutée au workflow. Lorsque vous ajoutez cette activité, un nouveau champ est créé dans la structure de la compétence. Ce champ servira à enregistrer les résultats de la classification et apparaîtra dans la structure des champs de la compétence ; cependant, il sera marqué comme champ masqué et ne sera pas modifiable. Vous pouvez changer le nom de ce champ dans le panneau Activity Properties de l’onglet Activities. Renommez le champ en “Layout”.
  3. En fonction des résultats de la classification, les documents doivent être acheminés vers différentes activités au sein du flux de traitement. Pour bifurquer le workflow, insérez l’activité IF : a. Cliquez sur l’activité Classify By Text and Image dans le workflow. b. Dans la fenêtre contextuelle, sélectionnez l’élément IF. Il sera ajouté au workflow après l’activité Classify By Text and Image.
Remarque : Au lieu d’utiliser l’activité IF, vous pouvez créer un élément de workflow contenant deux activités Extraction Rules et sélectionner le champ “Layout” comme champ source afin que ses valeurs servent de conditions pour choisir quelle activité sera appliquée à chaque document. Pour plus d’informations sur cette option, consultez Plusieurs ensembles de règles d’extraction au sein d’une seule activité.
  1. Nous allons maintenant ajouter les activités d’extraction de données pour les différentes classes de documents. a. Sélectionnez l’activité Extraction Rules comme élément suivant. Renommez-la en “Sick Note DE”. Cette activité extraira des données des documents allemands. b. Nous avons maintenant besoin d’une activité qui extraira des données des documents belges et néerlandais. Il existe des variantes au sein de cette classe de documents, mais elles peuvent être gérées par une seule activité Extraction Rules. Cliquez sur l’activité IF et ajoutez une autre activité Extraction Rules au workflow. Renommez l’activité en “Sick Note BE-NL”. L’activité IF doit maintenant être connectée aux deux activités Extraction Rules ainsi qu’à Finish.
  2. Nous voulons que Vantage continue d’entraîner la compétence à partir des documents traités. Pour cela, nous devons ajouter l’activité Fast Learning à la fin du workflow. Nous entraînerons également cette activité lors de la configuration de la compétence, mais l’objectif principal est d’activer l’Online Learning pour la compétence en production. a. Cliquez sur “Sick Note BE-NL” dans le flux de traitement. b. Dans la fenêtre contextuelle, sélectionnez l’activité Fast Learning. Elle sera ajoutée après l’activité “Sick Note BE-NL”, mais l’activité “Sick Note DE” restera connectée à Finish. c. Survolez avec la souris la flèche qui relie l’activité “Sick Note DE” à Finish. La flèche doit devenir orange. d. Faites glisser et déposez cette flèche sur l’activité Fast Learning. e. Survolez la flèche qui relie l’activité IF à Finish. Faites également glisser et déposer cette flèche sur l’activité Fast Learning. Désormais, tous les documents seront acheminés vers l’activité Fast Learning.
Votre configuration finale devrait ressembler à ceci : Diagramme du workflow montrant le pipeline de traitement Les points d’exclamation indiquent que les activités n’ont pas encore été configurées. Nous les configurerons dans les étapes suivantes.