Passer au contenu principal
Les documents semi-structurés se différencient des documents structurés en ce que leur ensemble de champs varie d’une image à l’autre. Lors de la création d’un élément, gardez à l’esprit que l’objet correspondant peut ne pas apparaître sur certaines images, ce qui rend impossible sa détection. Les images peuvent également être mal numérisées (par exemple, certaines zones peuvent devenir trop sombres ou trop claires), entraînant une perte de données. Dans ce cas, l’objet correspondant ne sera pas détecté non plus. L’éditeur Extraction Rules Activity permet au programme de continuer à rechercher d’autres éléments si un élément donné est absent d’une image. Pour poursuivre l’appariement pour les images qui ne contiennent pas un objet donné, celui-ci doit être défini comme facultatif.

Éléments requis

Les objets d’image décrits à l’aide d’éléments requis sont censés être toujours présents sur une image et doivent être détectés lors de l’appariement d’une activité Extraction Rules. Toutefois, si un tel objet n’est pas détecté, l’appariement est interrompu.

Éléments facultatifs

Les objets d’image décrits à l’aide d’éléments facultatifs peuvent être absents d’une image ou ne pas être détectés. Contrairement aux éléments obligatoires, cela n’interrompt pas l’appariement, et les objets d’image décrits par d’autres éléments seront tout de même détectés. Par défaut, tous les éléments simples sont facultatifs, ce qui signifie qu’ils ne sont pas exigés sur les images. À l’inverse, tous les éléments composés sont définis comme obligatoires par défaut.

Éléments interdits

Parfois, la présence d’un élément spécifique doit indiquer qu’une chaîne d’hypothèses est incorrecte. De tels éléments sont appelés éléments interdits. La détection de ce type d’élément interrompt la génération de l’arbre d’hypothèses dans lequel l’élément a été détecté. Ces éléments peuvent servir à empêcher l’association d’une activité Extraction Rules incorrecte à un document.

Configuration du type d’élément

Pour définir si un élément est requis, facultatif ou interdit, utilisez la propriété L’élément est dans le volet Propriétés.