Passer au contenu principal
Définissez des zones de recherche pour les éléments en spécifiant des régions sur les images de documents où le programme doit rechercher des objets, à l’aide de coordonnées absolues ou de relations avec des éléments d’ancrage. Une zone de recherche est une région de l’image où le programme doit rechercher des objets correspondant à un élément spécifique. Elle est déterminée d’après les conditions spécifiées dans la section Où rechercher du volet Propriétés. Dans les documents semi-structurés, certains objets peuvent apparaître à des emplacements différents d’un document à l’autre, et le programme ne pourra donc pas toujours les trouver à l’aide de zones de recherche absolues. Dans ce cas, les zones de recherche peuvent être définies par rapport à des éléments à emplacement fixe ou à des champs déjà détectés. Il existe également des cas où un élément peut être détecté sans définir de zone de recherche (par ex. un élément Static Text contenant toujours un mot unique au document peut être détecté sur la base de ce seul mot) ou en limitant la zone de recherche à la première ou à la dernière page d’un document.

Définir une zone de recherche

Pour définir une zone de recherche pour un élément :
  1. Créez et configurez des éléments dits « ancres ». Tout élément déjà détecté peut servir d’ancre, à condition de pouvoir définir des relations entre lui et l’élément que vous souhaitez que le programme détecte. Faites correspondre les éléments avec votre image à l’aide de la commande Match et vérifiez qu’ils sont correctement détectés.
  2. Créez un élément correspondant à l’objet d’image que vous souhaitez détecter et définissez ses propriétés dans la section What to search for.
  3. Indiquez la zone de recherche dans la section Where to search. a. Dans la liste déroulante Search on, sélectionnez Whole Document si vous devez rechercher dans l’ensemble du document, ou First Page ou Last Page si vous devez limiter la recherche à la première ou à la dernière page. Lorsque vous définissez la zone de recherche de cette manière, aucune ancre n’est requise. b. Si nécessaire, définissez les relations entre l’élément à détecter et d’autres éléments, ou dessinez une zone de recherche directement sur l’image. Vous pouvez définir les limites de la zone de recherche par rapport à d’autres éléments, exclure certains éléments de la zone, ou indiquer quel élément ou quel bord de page est le plus proche de l’élément à détecter.
  4. Cliquez sur Match pour vérifier que votre élément est correctement détecté sur tous les documents.

Définition d’une zone de recherche sur l’image du document

Dans la plupart des cas, vous définirez une zone de recherche par rapport à l’emplacement d’autres éléments de recherche servant d’ancres. Un élément ne peut être utilisé comme ancre que s’il a été trouvé sur l’image ; commencez donc par configurer et faire correspondre les éléments qui serviront d’ancres. Cliquez sur le bouton Draw on Image et tracez une zone de recherche sur votre image. La zone de recherche doit être proche des régions des éléments d’ancrage ou les intersecter. Dans la section Where to search, les propriétés Right of, Below, Left of et Above s’affichent pour la zone de recherche dessinée, ainsi que des coordonnées pour indiquer les distances de ces propriétés par rapport à la zone de recherche et aux éléments d’ancrage. Ces propriétés sont synchronisées avec la zone de recherche sur l’image. Vous pouvez modifier la zone de recherche à tout moment, soit en ajustant la zone sur l’image, soit en changeant les propriétés de relation dans le volet Properties. Lorsque vous sélectionnez une relation dans le volet Properties, le demi-plan défini par cette relation est mis en surbrillance sur l’image du document. Ensuite, ajustez les relations pour les éléments d’ancrage et la zone de recherche à l’aide de la barre d’outils des éléments d’ancrage, accessible en cliquant sur la région d’un élément : AD_ExtractionRules_SearchArea_Tools
  • Les flèches directionnelles permettent d’activer ou de désactiver les relations de recherche d’objet par rapport à l’élément dans la direction correspondante.
  • L’outil de suppression des relations retire toutes les relations définies pour l’élément sélectionné.
  • L’outil « plus proche » indique que, parmi toutes les hypothèses d’élément, celle la plus proche de l’élément sélectionné doit être retenue si toutes les autres conditions sont remplies de manière équivalente. Lors de la formulation des hypothèses, l’objet le plus proche de l’élément sélectionné est choisi. Si cet outil est utilisé, la propriété Nearest to apparaît dans le volet Properties. Cette propriété ne peut être définie que pour un seul élément d’ancrage.
  • L’outil d’exclusion exclut l’élément sélectionné de la zone de recherche. Il est utilisé lorsqu’un élément à l’intérieur de la zone de recherche peut être confondu avec l’objet recherché. Par exemple, si vous recherchez un élément Character String avec un jeu de caractères, un autre élément Character String avec le même jeu de caractères ou un jeu similaire peut être sélectionné par erreur. Pour éviter cela, excluez le second élément de la zone de recherche à l’aide de l’outil d’exclusion. Lorsque vous utilisez cet outil, la propriété Exclude apparaît dans le volet Properties.
Lorsque vous avez terminé de configurer la zone de recherche, cliquez sur le bouton Draw on Image pour quitter le mode Draw Search Area.

Définition d’une zone de recherche dans le panneau Propriétés

Ces relations sont équivalentes à celles configurées à l’aide de la barre d’outils de l’élément d’ancrage décrite ci-dessus. Vous pouvez modifier chaque relation séparément. Si vous activez le mode Dessiner une zone de recherche, la zone de recherche et le demi-plan défini par la relation sélectionnée s’affichent sur l’image du document. La zone de recherche est synchronisée avec les propriétés de la relation.

À droite de, En dessous, À gauche de, Au-dessus, Exclure

Dans la section Où chercher, cliquez sur Ajouter et sélectionnez le type de relation que vous souhaitez configurer. Dans la boîte de dialogue qui s’ouvre, sélectionnez un élément d’ancrage. Vous pouvez sélectionner n’importe quel élément actif situé au‑dessus de l’élément actuel. Vous pouvez ajouter plusieurs relations de chacun de ces types. Vous pouvez modifier la zone de recherche en ajustant le décalage pour les relations À droite de, En dessous, À gauche de et Au-dessus. Une valeur de décalage positive signifie que la limite sera déplacée dans la même direction que celle indiquée par la relation. Une valeur de décalage négative déplace la limite dans la direction opposée. Par exemple, un décalage négatif pour la relation À droite de déplacera la limite vers la gauche. Vous pouvez également choisir la limite de l’élément à partir de laquelle la zone de recherche sera calculée. Par défaut, la limite est définie de façon à ne pas inclure l’élément d’ancrage dans la zone de recherche (au‑dessus de la limite supérieure, en dessous de la limite inférieure, etc.). Vous pouvez aussi calculer la zone de recherche à partir de la limite opposée de l’élément d’ancrage (au‑dessus de la limite inférieure, en dessous de la limite supérieure, etc.) ou à partir de son centre. Pour ajuster ce paramètre, cliquez sur l’icône de limite affichée pour la relation concernée.

Exemple

Supposons que vous deviez trouver une séquence précise de caractères située au-dessus d’un texte statique prédéfini sur certains documents et au même niveau que ce texte statique sur d’autres. Régler la valeur Au-dessus sur 0 exclura de la zone de recherche les éléments au même niveau que le texte statique, ce qui signifie que votre élément ne se trouvera pas dans la zone de recherche sur certaines images : Exemple 1 Exemple 1b En revanche, régler la valeur Au-dessus sur -50 ou cliquer sur l’icône de délimitation et sélectionner Limite inférieure de la région inclura à la fois la zone au même niveau que le texte statique et la zone située au-dessus, garantissant ainsi que votre élément se trouve à l’intérieur de la zone de recherche sur toutes les images : Exemple 2 Exemple 2b

Le plus proche de

Lorsque vous définissez cette relation dans le volet Propriétés, vous pouvez sélectionner un élément de recherche ou l’un des bords de la Page comme ancre. C’est la seule relation que vous pouvez définir pour le premier élément de l’arborescence. Vous ne pouvez ajouter qu’une seule relation de ce type. Vous ne pouvez pas ajouter cette relation aux éléments Group et Repeating Group, mais vous pouvez l’ajouter aux éléments enfants d’un groupe ou d’un groupe répétitif.

Utilisation d’un élément de groupe répétitif comme élément d’ancrage

Lorsque vous sélectionnez un élément d’ancrage pour une relation, vous constaterez que les éléments de groupe répétitif et leurs éléments enfants sont toujours grisés. Toutefois, vous pouvez utiliser ces éléments comme éléments d’ancrage. Pour configurer une relation avec un élément de groupe répétitif, cliquez sur l’icône du menu d’édition à droite du nom de l’élément et sélectionnez l’instance qui servira d’élément d’ancrage. Vous pouvez spécifier la dernière instance trouvée, toutes les instances terminées ou une instance portant un numéro donné.

Modification et suppression des relations

Vous pouvez changer l’élément d’ancrage d’une relation existante en double-cliquant la relation dans le volet Properties. Les paramètres de décalage et de limites seront conservés. Les relations existantes peuvent être supprimées soit via le volet de l’élément d’ancrage, soit à l’aide du bouton Supprimer à côté de la propriété correspondante dans le volet Properties. Pour supprimer une zone de recherche, cliquez sur l’icône Supprimer les relations dans la zone de recherche. Vous pouvez aussi sélectionner Whole Document, First Page ou Last Page dans la propriété Search on.