Passer au contenu principal
Une zone de recherche est une région de l’image où le programme doit rechercher des objets correspondant à un élément donné. Elle est déterminée en fonction des conditions spécifiées dans la section Où rechercher du volet Propriétés. Dans les documents semi-structurés, certains objets peuvent apparaître à des emplacements différents selon les documents, et le programme ne pourra donc pas toujours les trouver à l’aide de zones de recherche absolues. Dans ce cas, les zones de recherche peuvent être définies par rapport à des éléments à emplacement fixe ou à des champs déjà identifiés. Il existe également des cas où un élément peut être détecté sans définir de zone de recherche (par exemple, un élément Static Text contenant toujours un mot unique au document peut être détecté sur la base de ce seul mot) ou en limitant la zone de recherche à la première ou à la dernière page d’un document.

Spécification d’une zone de recherche

Pour spécifier une zone de recherche pour un élément :
  1. Créez et configurez des éléments dits d’ancrage. Tout élément déjà détecté peut servir d’élément d’ancrage, à condition que vous puissiez définir des relations entre celui-ci et l’élément que vous souhaitez que le programme détecte. Faites correspondre les éléments avec votre image à l’aide de la commande Match et vérifiez qu’ils sont correctement détectés.
  2. Créez un élément correspondant à l’objet d’image que vous souhaitez détecter et définissez ses propriétés dans la section What to search for.
  3. Spécifiez la zone de recherche dans la section Where to search. a. Dans la liste déroulante Search on, sélectionnez Whole Document si vous devez rechercher dans l’intégralité du document, ou First Page ou Last Page si vous devez limiter la recherche à la première ou à la dernière page. Lorsque vous spécifiez la zone de recherche de cette manière, aucun élément d’ancrage n’est nécessaire. b. Si besoin, définissez les relations entre l’élément à détecter et d’autres éléments, ou dessinez une zone de recherche directement sur l’image. Vous pouvez définir les limites de la zone de recherche par rapport à d’autres éléments, exclure certains éléments de la zone, ou préciser quel élément ou quel bord de page est le plus proche de l’élément à détecter.
  4. Cliquez sur Match pour vérifier que votre élément est correctement détecté sur tous les documents.

Spécifier une zone de recherche sur l’image du document

Dans la plupart des cas, vous spécifierez une zone de recherche par rapport à l’emplacement d’autres éléments de recherche utilisés comme ancres. Vous pouvez utiliser un élément comme ancre uniquement s’il a été trouvé sur l’image ; vous devez donc d’abord configurer et faire correspondre les éléments qui serviront d’ancres. Cliquez sur le bouton Draw on Image et dessinez une zone de recherche sur votre image. La zone de recherche doit être proche des régions des éléments d’ancrage ou les croiser. Dans la section Where to search, les propriétés Right of, Below, Left of et Above apparaissent pour la zone de recherche que vous avez dessinée, ainsi que des coordonnées pour spécifier les distances de ces propriétés par rapport à la zone de recherche et aux éléments d’ancrage. Ces propriétés sont synchronisées avec la zone de recherche sur l’image. Vous pouvez modifier la zone de recherche à tout moment, soit en la redimensionnant directement sur l’image, soit en ajustant les propriétés de relation dans le panneau Properties. Lorsque vous sélectionnez une relation dans le panneau Properties, le demi-plan correspondant est mis en évidence sur l’image du document. Ensuite, ajustez les relations pour les éléments d’ancrage et la zone de recherche à l’aide de la barre d’outils des éléments d’ancrage, accessible en cliquant sur la région d’un élément : AD_ExtractionRules_SearchArea_Tools
  • Les flèches directionnelles permettent d’activer ou de désactiver les relations de recherche d’objet par rapport à l’élément dans la direction correspondante.
  • L’outil de suppression des relations supprime toutes les relations définies pour l’élément sélectionné.
  • L’outil « plus proche » indique que, parmi toutes les hypothèses d’élément, celle la plus proche de l’élément sélectionné doit être retenue si toutes les autres conditions sont remplies à l’identique. Lors de la formulation des hypothèses, l’objet le plus proche de l’élément sélectionné sera choisi. Si cet outil est utilisé, la propriété Nearest to apparaît dans le panneau Properties. Cette propriété ne peut être définie que pour un seul élément d’ancrage.
  • L’outil d’exclusion exclut l’élément sélectionné de la zone de recherche. Il s’utilise lorsqu’un élément à l’intérieur de la zone de recherche peut être confondu avec l’objet recherché. Par exemple, si vous recherchez un élément Character String avec un jeu de caractères donné, un autre élément Character String avec le même jeu de caractères ou un jeu similaire peut être choisi par erreur. Pour éviter cela, excluez le second élément de la zone de recherche à l’aide de l’outil d’exclusion. Lorsque vous utilisez cet outil, la propriété Exclude apparaît dans le panneau Properties.
Lorsque vous avez terminé de configurer la zone de recherche, cliquez sur le bouton Draw on Image pour quitter le mode Draw Search Area.

Définition d’une zone de recherche dans le panneau Propriétés

Ces relations sont équivalentes à celles configurées à l’aide de la barre d’outils de l’élément d’ancrage décrite ci-dessus. Vous pouvez modifier chaque relation séparément. Si vous activez le mode Dessiner une zone de recherche, la zone de recherche et le demi-plan défini par la relation sélectionnée s’affichent sur l’image du document. La zone de recherche est synchronisée avec les propriétés de la relation.

À droite de, En dessous, À gauche de, Au-dessus, Exclure

Dans la section Où chercher, cliquez sur Ajouter et sélectionnez le type de relation que vous souhaitez configurer. Dans la boîte de dialogue qui s’ouvre, sélectionnez un élément d’ancrage. Vous pouvez sélectionner n’importe quel élément actif situé au‑dessus de l’élément actuel. Vous pouvez ajouter plusieurs relations de chacun de ces types. Vous pouvez modifier la zone de recherche en ajustant le décalage pour les relations À droite de, En dessous, À gauche de et Au-dessus. Une valeur de décalage positive signifie que la limite sera déplacée dans la même direction que celle indiquée par la relation. Une valeur de décalage négative déplace la limite dans la direction opposée. Par exemple, un décalage négatif pour la relation À droite de déplacera la limite vers la gauche. Vous pouvez également choisir la limite de l’élément à partir de laquelle la zone de recherche sera calculée. Par défaut, la limite est définie de façon à ne pas inclure l’élément d’ancrage dans la zone de recherche (au‑dessus de la limite supérieure, en dessous de la limite inférieure, etc.). Vous pouvez aussi calculer la zone de recherche à partir de la limite opposée de l’élément d’ancrage (au‑dessus de la limite inférieure, en dessous de la limite supérieure, etc.) ou à partir de son centre. Pour ajuster ce paramètre, cliquez sur l’icône de limite affichée pour la relation concernée.

Exemple

Supposons que vous deviez trouver une séquence précise de caractères située au-dessus d’un texte statique prédéfini sur certains documents et au même niveau que ce texte statique sur d’autres. Si vous définissez Au-dessus sur 0, la zone de recherche n’inclura pas les éléments au même niveau que le texte statique, ce qui signifie que votre élément ne se trouvera pas dans la zone de recherche sur certaines images : Exemple 1 Exemple 1b En revanche, définir Au-dessus sur -50 ou cliquer sur l’icône de limite puis sélectionner la Limite inférieure de la région inclura à la fois la zone au même niveau que le texte statique et la zone au-dessus, ce qui garantit que votre élément se trouvera dans la zone de recherche sur toutes les images : Exemple 2 Exemple 2b

Le plus proche de

Lorsque vous définissez cette relation dans le volet Propriétés, vous pouvez sélectionner un élément de recherche ou l’un des bords de la Page comme ancre. C’est la seule relation que vous pouvez définir pour le premier élément de l’arborescence. Vous ne pouvez ajouter qu’une seule relation de ce type. Vous ne pouvez pas ajouter cette relation aux éléments Group et Repeating Group, mais vous pouvez l’ajouter aux éléments enfants d’un groupe ou d’un groupe répétitif.

Utilisation d’un élément de groupe répétitif comme élément d’ancrage

Lorsque vous sélectionnez un élément d’ancrage pour une relation, vous constaterez que les éléments de groupe répétitif et leurs éléments enfants sont toujours grisés. Toutefois, vous pouvez utiliser ces éléments comme éléments d’ancrage. Pour configurer une relation avec un élément de groupe répétitif, cliquez sur l’icône du menu d’édition à droite du nom de l’élément et sélectionnez l’instance qui servira d’élément d’ancrage. Vous pouvez spécifier la dernière instance trouvée, toutes les instances terminées ou une instance portant un numéro donné.

Modification et suppression des relations

Vous pouvez changer l’élément d’ancrage d’une relation existante en double-cliquant la relation dans le volet Properties. Les paramètres de décalage et de limites seront conservés. Les relations existantes peuvent être supprimées soit via le volet de l’élément d’ancrage, soit à l’aide du bouton Supprimer à côté de la propriété correspondante dans le volet Properties. Pour supprimer une zone de recherche, cliquez sur l’icône Supprimer les relations dans la zone de recherche. Vous pouvez aussi sélectionner Whole Document, First Page ou Last Page dans la propriété Search on.