Configurez le comportement de détection des éléments en définissant des éléments comme requis, facultatifs ou interdits afin de contrôler la poursuite de l’appariement lorsque des objets sont absents ou mal détectés.
Les documents semi-structurés se différencient des documents structurés en ce que leur ensemble de champs varie d’une image à l’autre. Lors de la création d’un élément, gardez à l’esprit que l’objet correspondant peut ne pas apparaître sur certaines images, ce qui rend impossible sa détection. Les images peuvent également être mal numérisées (par exemple, certaines zones peuvent devenir trop sombres ou trop claires), entraînant une perte de données. Dans ce cas, l’objet correspondant ne sera pas détecté non plus. L’éditeur Extraction Rules Activity permet au programme de continuer à rechercher d’autres éléments si un élément donné est absent d’une image. Pour poursuivre l’appariement pour les images qui ne contiennent pas un objet donné, celui-ci doit être défini comme facultatif.
Les objets d’image décrits à l’aide d’éléments requis sont censés être toujours présents sur une image et doivent être détectés lors de l’appariement d’une activité Extraction Rules. Toutefois, si un tel objet n’est pas détecté, l’appariement est interrompu.
Les objets d’image décrits à l’aide d’éléments facultatifs peuvent être absents d’une image ou ne pas être détectés. Contrairement aux éléments obligatoires, cela n’interrompt pas l’appariement, et les objets d’image décrits par d’autres éléments seront tout de même détectés.Par défaut, tous les éléments simples sont facultatifs, ce qui signifie qu’ils ne sont pas exigés sur les images. À l’inverse, tous les éléments composés sont définis comme obligatoires par défaut.
Parfois, la présence d’un élément spécifique doit indiquer qu’une chaîne d’hypothèses est incorrecte. De tels éléments sont appelés éléments interdits. La détection de ce type d’élément interrompt la génération de l’arbre d’hypothèses dans lequel l’élément a été détecté. Ces éléments peuvent servir à empêcher l’association d’une activité Extraction Rules incorrecte à un document.