Sélection d’un bloc Table et définition des contraintes de recherche pour les colonnes
Liez un élément Table à son bloc Table et définissez les contraintes de recherche des colonnes : détection des noms de colonnes par mot-clé, vérification du type de contenu et limites.
Vous pouvez sélectionner le bloc Table à lier à l’élément Table actuel dans l’onglet Colonnes de la boîte de dialogue Propriétés de l’élément.
Afficher l’onglet Colonnes de la boîte de dialogue Propriétés
Chaque élément Table doit correspondre à un bloc Table qu’il doit rechercher. Pour sélectionner un bloc Table, cliquez sur le bouton Sélectionner, puis sélectionnez le bloc Table correspondant à l’élément Table actif. La liste de toutes ses colonnes s’affiche dans le champ List1. Définissez les propriétés de chacune des colonnes : elles serviront de contraintes de recherche lors de la recherche des colonnes.
La liste des colonnes du bloc affichée dans l’onglet Colonnes de la boîte de dialogue Propriétés de l’élément ne peut pas être modifiée dans cette boîte de dialogue. Pour modifier cette liste, vous devez ouvrir la boîte de dialogue Propriétés du bloc.
Pour mieux comprendre le lien entre un élément et le bloc qui lui correspond, tenez compte de ce qui suit : un bloc Table sert d’interface entre le FlexiLayout et une application de capture de données, tandis qu’un élément Table constitue l’implémentation de cette interface. Un élément Table contient les instructions indiquant comment trouver le bloc Table. Vous pouvez créer plusieurs implémentations de programme pour une même interface. De même, vous pouvez créer plusieurs éléments Table pour un bloc Table (mais pas l’inverse).
Lorsque vous testez votre FlexiLayout, vous devrez peut-être désactiver une colonne sans la supprimer complètement du FlexiLayout. La désactivation d’une colonne conserve toutes les informations la concernant dans le FlexiLayout, mais indique au programme d’ignorer cette colonne lors du test du FlexiLayout. Pour désactiver une colonne, sélectionnez celle que vous souhaitez désactiver dans le champ List1, puis cliquez sur Disable. Cela décoche la case située à côté du nom de la colonne. Pour réactiver la colonne, sélectionnez son nom dans la liste, puis cliquez sur Enable.
Lorsque vous désactivez une colonne, elle est automatiquement désactivée dans toutes les listes d’ordre de l’onglet Order.
Définition des contraintes de recherche pour les colonnes du tableau
Les contraintes de recherche pour les colonnes du tableau se définissent dans la boîte de dialogue Propriétés des colonnes. Pour ouvrir la boîte de dialogue Propriétés d’une colonne, sélectionnez la colonne dans le champ List1, puis cliquez sur le bouton Properties… situé à côté du champ.
Afficher la boîte de dialogue Propriétés de la colonne
Les noms des colonnes figurant dans l’en-tête du tableau jouent un rôle important dans la détection des colonnes. Pour aider le programme à détecter les noms des colonnes, vous pouvez utiliser des mots-clés figurant dans l’en-tête. Il est également possible de détecter le nom d’une colonne en se basant sur un autre élément, dont la région sera alors également considérée comme celle du nom de la colonne.
Utilisation de mots-clés pour détecter les noms de colonnes
Pour détecter le nom d’une colonne à l’aide de mots-clés, sélectionnez l’option Detect by keyword in name. Dans le champ ci-dessous, saisissez les mots-clés ou expressions figurant dans le nom de la colonne sur les images de test. Appuyez sur Entrée après avoir saisi chaque mot-clé.Si vous souhaitez que le programme recherche les noms de colonnes uniquement à partir de mots complets, sélectionnez l’option Whole words only.Dans une colonne étroite, les mots du nom passent souvent à la ligne suivante. Sélectionnez l’option Multi-line name pour détecter les noms de colonnes présentés de cette manière.Comme une même colonne peut avoir des noms différents selon les images, la liste des mots-clés doit inclure toutes les variantes possibles susceptibles d’apparaître. Toutefois, sur certaines images, la colonne peut ne pas avoir de nom ou être totalement absente. C’est pourquoi le nom d’une colonne est toujours facultatif. Cela signifie qu’il n’est pas nécessaire de trouver le nom d’une colonne lors de la mise en correspondance du FlexiLayout avec les images. Si un mot-clé n’est pas trouvé (soit parce qu’il est effectivement absent, soit parce que la qualité de l’image est insuffisante pour l’OCR), l’hypothèse est pénalisée : sa qualité est multipliée par la qualité de l’hypothèse nulle pour le mot-clé non détecté. La pénalité appliquée à l’hypothèse est définie dans le champ Missing keyword penalty. La valeur par défaut est 0.97.
Utilisation de la région d’un autre élément pour détecter les noms de colonnes
Vous pouvez utiliser un élément déjà trouvé pour identifier le nom d’une colonne. Cela vous permet de définir des contraintes de recherche supplémentaires sur le mot-clé. Cette méthode vous permet également de rechercher non seulement un Static Text, mais aussi une Character String, du texte inversé, ou simplement une région.Pour trouver le nom d’une colonne à l’aide d’un élément déjà trouvé, sélectionnez l’option Use found element as column name, puis cliquez sur et, dans la boîte de dialogue Select Element, sélectionnez l’élément dont la région sera également considérée comme celle du nom de la colonne.
L’élément que vous utilisez pour détecter le nom d’une colonne doit être situé au-dessus de l’élément Table concerné dans l’arborescence FlexiLayout. Lors de la définition d’un tableau multipage, il est recommandé d’utiliser des éléments répétitifs pour rechercher un nom de colonne (consultez Détection des tableaux multipages pour plus d’informations sur les tableaux multipages).
Vérifier si la colonne a été correctement détectée
Lors de la recherche de colonnes, le programme utilise non seulement des informations sur leur nom, mais aussi sur leur contenu. Ainsi, si vous savez qu’une colonne donnée contient un certain type de données, vous pouvez le préciser afin d’aider le programme à détecter la colonne de manière plus fiable. Pour permettre à FlexiLayout Studio de vérifier le type de contenu d’une colonne, sélectionnez l’option Check content type et, dans le champ Type of column content, spécifiez l’un des types de données disponibles que la colonne est susceptible de contenir :
Texte ;
Devise ;
Date ;
Expression régulière ;
Nombre.
Si vous avez sélectionné le type Expression régulière, vous devez saisir le code de l’expression régulière qui décrit le format des données de la colonne.
Alphabet des expressions régulières
N’importe quel caractère
*
“k”*“t” – autorise ‘kit’, ‘kat’, etc.
Lettre
C
C”at” – autorise cat, bat, Rat, mat, etc.
Lettre majuscule
A
A”at” – autorise Cat, Bat, Rat, Mat, etc.
Lettre minuscule
a
a”at” – autorise car, bat, rat, mat, etc.
Lettre ou chiffre
Х
X – autorise n’importe quelle lettre ou n’importe quel chiffre seul.
Chiffre
N
N”th” autorise 5th, 4th, 6th, etc.
string
""
"cat”
Ou
|
“dr”(“i”|“u”)“nk” – autorise “drink” ou “drunk”.
Caractère appartenant à l’ensemble
[]
[hm]“at” – autorise ‘hat’ ou ‘mat’.
Caractère n’appartenant pas à l’ensemble
[^]
[^b]“at” – autorise ‘cat’, ‘mat’, ‘rat’, mais pas bat.
Nombre illimité de répétitions
(s’applique à l’expression ou à la sous-expression située à gauche)
{-}
[AB74]{-} – autorise n’importe quelle combinaison de A, B, 7 et 4, quelle qu’en soit la longueur.
Le nombre de répétitions est n
{n}
N{2}“th” autorise 25th, 84th, 11th, etc.
de n à m répétitions
{n-m}
N{1-3}“th” autorise 5th, 84th, 111th, etc.
de 0 à n répétitions
{-n}
N{-2}“th” autorise th, 84th, 4th, etc.
n répétitions ou plus
{n-}
N{2-}“th” autorise 25th, 834th, 311th, 34576th, etc.
Sous-expression
()
Si le type de données de la colonne ne correspond pas à celui indiqué dans le champ Type du contenu de la colonne, l’hypothèse sera pénalisée. Le champ Pénalité pour contenu manquant contient le coefficient par lequel la qualité de l’hypothèse sera multipliée si le contenu de la colonne ne correspond pas au type de données spécifié.
Spécification des coordonnées de la zone de recherche
Vous pouvez spécifier les coordonnées des zones de recherche associées aux limites gauche et droite d’une colonne. Dans la propriété Absolute area constraints, saisissez respectivement les coordonnées de chacune de ces zones de recherche dans les champs Left boundary et Right boundary.