Règles et activités d’extraction pour les documents semi-structurés
Débogage de l’activité Extraction Rules
Le débogage de l’activité Extraction Rules consiste à vérifier et corriger les propriétés de l’activité. Une fois un élément créé, nous recommandons de compiler l’activité puis de l’appliquer à chaque image de test. Assurez-vous que l’activité ne contient aucune erreur et que tous les objets requis sont correctement appariés. Parfois, certains objets ne sont pas détectés parce qu’ils ne se trouvent pas dans la zone de recherche ou parce qu’ils ne respectent pas les propriétés de l’élément.Le débogage consiste donc à repérer des images présentant des erreurs d’appariement, à formuler et analyser des hypothèses, à corriger les propriétés des éléments, puis à relancer l’appariement. Une fois l’activité corrigée, elle doit être de nouveau appliquée aux pages problématiques pour vérifier que les erreurs ont été corrigées, ainsi qu’à toutes les autres pages (afin de s’assurer que les corrections n’ont pas perturbé l’appariement des autres pages). En général, les résultats d’appariement sont consultés à plusieurs reprises lors de la création d’une activité Extraction Rules.L’appariement est effectué uniquement pour les éléments et les champs actifs. Sa durée est directement liée au nombre d’éléments actifs. Pour réduire le temps d’appariement pendant le débogage, vous pouvez désactiver temporairement les éléments qui n’affectent pas les résultats pour l’élément sur lequel vous travaillez. Vous pouvez modifier l’état d’un élément via son menu contextuel. Vous pouvez également sélectionner plusieurs éléments et modifier leur état simultanément.
Remarque : N’oubliez pas de désactiver les champs liés aux éléments désactivés, sans quoi l’appariement ne démarrera pas.