Passer au contenu principal
Habituellement, les champs sont détectés à partir de leur nom, mais tous les champs de nos documents n’en ont pas. Par exemple, le champ contenant le nom de la recette n’a pas de nom. Il faut donc adopter une autre approche pour détecter ce champ. La solution la plus évidente qui vient à l’esprit consiste à indiquer au programme que le nom de la recette est l’objet le plus proche de l’en-tête du formulaire. Mais si vous regardez l’image de test 6, vous verrez que, sur cette image, le champ le plus proche est Recipe #:. Il est parfois possible de définir des contraintes de recherche supplémentaires pour aider le programme à distinguer les deux champs, mais dans ce cas précis, il est très difficile de les différencier : le nom de la recette et le champ Recipe #: sont très proches l’un de l’autre et présentent des structures similaires :
  1. Le nom Recipe #: et le champ lui-même se trouvent sur la même ligne. Le champ peut contenir les mêmes caractères que ceux pouvant être utilisés dans le nom de la recette.
  2. Rien ne garantit que le texte du nom de la recette sera toujours plus long que le nom Recipe #: et son champ.
Notez toutefois que la pré-reconnaissance détecte systématiquement le nom Recipe #: sur toutes les images de test. Cela signifie que vous pouvez demander au programme de rechercher d’abord Recipe #:. Ensuite, le programme recherchera le nom de la recette : il devra rechercher l’objet le plus proche de l’en-tête du document, mais qui n’est PAS Recipe #: (qui aura alors déjà été détecté).