Passer au contenu principal
Le programme génère des hypothèses White Gap en créant les histogrammes des objets candidats. Par défaut, le programme recherche un White Gap entre des objets Any Text. Pour rechercher un White Gap entre d’autres types d’objets (par ex. entre des objets de type Separator), vous devez définir la contrainte correspondante dans la boîte de dialogue Properties de l’élément White Gap (onglet Advanced, champ Relations avancées avant recherche). Par exemple, si vous devez trouver un White Gap dans une zone où tous les types d’objets peuvent apparaître, vous devez écrire l’expression suivante : Type: PictureObject + SeparatorObject+ AnyText + PunctuationMark + CheckMarkObject;.”

Un histogramme est créé comme suit :

Le programme projette sur l’axe horizontal ou vertical tous les objets d’un certain type détectés dans la zone de recherche. La projection correspond à la somme des largeurs ou des hauteurs des objets. Lorsqu’il recherche un espace horizontal, le programme crée une projection sur l’axe vertical. Lorsqu’il recherche un espace vertical, le programme crée une projection sur l’axe horizontal ; lorsqu’il recherche un espace horizontal, le programme crée une projection sur l’axe vertical. La dimension linéaire de chaque objet de la taille donnée est ajoutée à la projection. Par exemple, pour trouver un White Gap vertical parmi les objets texte, le programme additionne les hauteurs de tous les objets texte situés dans la zone de recherche au-dessus d’un point donné sur l’axe horizontal et qui intersectent la zone de recherche de l’élément. Le programme recherche ensuite les régions où la hauteur de l’histogramme est inférieure à une certaine valeur. Ces régions correspondent à des zones dans lesquelles le nombre d’objets est relativement faible et où leur projection est inférieure à une valeur prédéfinie. Le programme doit autoriser la présence d’un certain nombre d’objets dans le White Gap, car les images réelles contiennent souvent des taches et d’autres parasites introduits lors de la numérisation, qui doivent être ignorés lors de la recherche d’espaces entre les colonnes ou les paragraphes. Le bruit de fond n’affecte pas sensiblement le profil global. Supposons que nous ayons des objets texte H1, H2,…, H9 dans la zone de recherche. Dans la figure ci-dessous, ces objets sont mis en évidence en noir. Supposons que la recherche contienne d’autres types d’objets (mis en évidence en rouge). Pour trouver le White Gap vertical, nous devons calculer la somme des projections des objets texte sur l’axe horizontal. L’histogramme obtenu est présenté dans la figure ci-dessous. Vous pouvez voir que les objets non textuels sont ignorés dans l’histogramme. Ensuite, nous devons trouver le maximum de l’histogramme (indiqué par Max dans la figure). La valeur du niveau maximal est ensuite multipliée par la valeur définie dans Threshold coefficient (%) (K=0.2). Le résultat est le niveau maximal autorisé du White Gap (indiqué par White Gap threshold dans la figure). Si le White Gap threshold obtenu est >0, d’autres objets peuvent être présents dans la zone du White Gap. Une fois le White Gap threshold calculé, il est comparé aux valeurs définies dans Lower threshold limit et Upper threshold limit. Si White Gap threshold < Lower threshold limit, White Gap threshold reçoit la valeur de Lower threshold limit et cette valeur sera utilisée pour rechercher le White Gap. Si White Gap threshold > Upper threshold limit, White Gap threshold reçoit la valeur de Upper threshold limit. Ensuite, les hauteurs de l’histogramme sont comparées au White Gap threshold afin de trouver les zones où le niveau de l’histogramme est inférieur au White Gap threshold. La propriété Largeur**/hauteur** min. définit la largeur absolue minimale du White Gap. Si la valeur est W2, les deux autres hypothèses seront rejetées. Une hypothèse White Gap possède les propriétés suivantes :
PropriétéDescription
Nom de l’élémentNom complet de l’élément.
PageNuméro de la page sur laquelle l’élément a été détecté.
Rectangle englobantCoordonnées du rectangle qui entoure la région de l’hypothèse.
WidthLargeur de la région de l’hypothèse.
HeightHauteur de la région de l’hypothèse.
OrientationOrientation du White Gap détecté.
Maximum de l’histogramme dans la zone de recherchePic de l’histogramme dans la zone de recherche.
White Gap thresholdPoint de l’histogramme en dessous duquel le programme commence à formuler des hypothèses White Gap.
Maximum de l’histogramme dans l’hypothèsePic du maximum de l’histogramme dans l’hypothèse.
DétectéIndique si l’objet décrit par l’élément a été trouvé (true) ou si une hypothèse nulle a été formulée (false).
Du meilleur cheminIndique si l’hypothèse trouvée appartient au meilleur chemin dans l’arbre d’hypothèses (true) ou non (false).
Qualité de pré-rechercheIndique dans quelle mesure l’hypothèse correspond aux propriétés de l’élément spécifiées par les paramètres de la boîte de dialogue Properties et par le code dans les relations avancées de pré-recherche.
Qualité de post-rechercheQualité de l’hypothèse après application des conditions du champ des relations avancées de post-recherche.
Qualité de chaîneQualité de la chaîne d’hypothèses, du premier sous-élément du groupe jusqu’au sous-élément actuel. La qualité de chaîne est calculée en multipliant les qualités de tous les sous-éléments de la chaîne et sert à comparer des chaînes d’hypothèses concurrentes.

White Gap

Repérez des zones rectangulaires vides à l’aide d’histogrammes d’objets, avec des propriétés d’orientation et de taille.

Zone de recherche

Indiquez à FlexiLayout où rechercher des objets à l’aide de coordonnées ou de relations.

Contraintes de recherche supplémentaires

Écrivez des contraintes supplémentaires en langage FlexiLayout dans l’onglet Advanced.