Passer au contenu principal
Le programme recherche des tableaux et les divise en colonnes et en lignes en s’appuyant sur les Separators et les White Gaps de l’image. De plus, les en-têtes et les pieds de tableau sont utilisés pour faciliter la détection des tableaux. Les en-têtes et les pieds de tableau servent de limites supérieure et inférieure aux corps de tableau. Aucune information n’en est extraite. L’en-tête contient les noms des colonnes, qui peuvent être utilisés pour diviser le tableau en colonnes. Une fois un tableau détecté, le programme formule des hypothèses pour l’élément de tableau entier, ses colonnes, ses lignes et ses cellules. Une hypothèse de Table possède les propriétés suivantes :
PropertyDescription
Element nameLe nom complet de l’élément.
PageLe numéro de la page sur laquelle l’élément a été détecté.
Rectangle englobantLes coordonnées du rectangle qui entoure la Region de l’hypothèse.
WidthLa largeur de la région de l’hypothèse.
HeightLa hauteur de la région de l’hypothèse.
Header foundIndique si l’en-tête de tableau a été détecté.
Footer foundIndique si le pied de tableau a été détecté.
Body foundIndique si le corps du tableau a été détecté.
Nom de l’ordreLe nom de l’ordre des colonnes détecté dans le tableau.
DetectedIndique si l’objet décrit par l’élément a été détecté (true) ou si une hypothèse nulle a été formulée (false).
Du meilleur cheminIndique si l’hypothèse trouvée appartient au meilleur chemin dans l’arbre des hypothèses (true) ou non (false).
Qualité avant rechercheIndique dans quelle mesure l’hypothèse correspond aux propriétés de l’élément spécifiées par les paramètres de la boîte de dialogue Propriétés et par le code du champ Relations avancées avant recherche.
Qualité après rechercheLa qualité de l’hypothèse après l’application des conditions du champ Relations avancées après recherche.
Qualité de chaîneLa qualité de la chaîne d’hypothèses, du premier sous-élément du groupe au sous-élément actuel. La qualité de la chaîne est calculée en multipliant les qualités de tous les sous-éléments de la chaîne et sert à comparer des chaînes d’hypothèses concurrentes.
Une hypothèse d’en-tête de tableau possède les propriétés suivantes :
PropertyDescription
Element nameLe nom complet de l’élément.
PageLe numéro de la page sur laquelle l’élément a été détecté.
Rectangle englobantLes coordonnées du rectangle qui entoure la Region de l’hypothèse.
WidthLa largeur de la région de l’hypothèse.
HeightLa hauteur de la région de l’hypothèse.
Column name listAffiche les colonnes du tableau trouvées.
DetectedIndique si l’objet décrit par l’élément a été détecté (true) ou si une hypothèse nulle a été formulée (false).
Du meilleur cheminIndique si l’hypothèse trouvée appartient au meilleur chemin dans l’arbre des hypothèses (true) ou non (false).
Qualité avant rechercheIndique dans quelle mesure l’hypothèse correspond aux propriétés de l’élément spécifiées par les paramètres de la boîte de dialogue Propriétés et par le code du champ Relations avancées avant recherche.
Qualité après rechercheLa qualité de l’hypothèse après l’application des conditions du champ Relations avancées après recherche.
Qualité de chaîneLa qualité de la chaîne d’hypothèses, du premier sous-élément du groupe au sous-élément actuel. La qualité de la chaîne est calculée en multipliant les qualités de tous les sous-éléments de la chaîne et sert à comparer des chaînes d’hypothèses concurrentes.
Une hypothèse de pied de tableau possède les propriétés suivantes :
PropriétéDescription
Nom de l’élémentNom complet de l’élément.
PageNuméro de la page sur laquelle l’élément a été détecté.
Rectangle englobantCoordonnées du rectangle qui entoure la région de l’hypothèse.
WidthLargeur de la région de l’hypothèse.
HeightHauteur de la région de l’hypothèse.
DétectéIndique si l’objet décrit par l’élément a été trouvé (true) ou si une hypothèse nulle a été formulée (false).
Du meilleur cheminIndique si l’hypothèse trouvée appartient au meilleur chemin dans l’arbre des hypothèses (true) ou non (false).
Qualité avant rechercheMesure dans laquelle l’hypothèse correspond aux propriétés de l’élément définies par les paramètres de la boîte de dialogue Propriétés et par le code du champ Relations avancées avant recherche.
Qualité après rechercheQualité de l’hypothèse après application des conditions du champ Relations avancées après recherche.
Qualité de chaîneQualité de la chaîne d’hypothèses, du premier sous-élément du groupe jusqu’au sous-élément actuel. La qualité de chaîne est calculée en multipliant les qualités de tous les sous-éléments de la chaîne et sert à comparer des chaînes d’hypothèses concurrentes.
Une hypothèse de corps de tableau possède les propriétés suivantes :
PropriétéDescription
Nom de l’élémentNom complet de l’élément.
PageNuméro de la page sur laquelle l’élément a été détecté.
Rectangle englobantCoordonnées du rectangle qui entoure la région de l’hypothèse.
WidthLargeur de la région de l’hypothèse.
HeightHauteur de la région de l’hypothèse.
Nom de l’ordreIndique le nom de l’ordre des colonnes trouvé.
Colonnes trouvéesIndique les noms des colonnes trouvées.
Nombre de lignesIndique le nombre de lignes trouvées dans le tableau.
DétectéIndique si l’objet décrit par l’élément a été trouvé (true) ou si une hypothèse nulle a été formulée (false).
Du meilleur cheminIndique si l’hypothèse trouvée appartient au meilleur chemin dans l’arbre des hypothèses (true) ou non (false).
Qualité avant rechercheMesure dans laquelle l’hypothèse correspond aux propriétés de l’élément définies par les paramètres de la boîte de dialogue Propriétés et par le code du champ Relations avancées avant recherche.
Qualité après rechercheQualité de l’hypothèse après application des conditions du champ Relations avancées après recherche.
Qualité de chaîneQualité de la chaîne d’hypothèses, du premier sous-élément du groupe jusqu’au sous-élément actuel. La qualité de chaîne est calculée en multipliant les qualités de tous les sous-éléments de la chaîne et sert à comparer des chaînes d’hypothèses concurrentes.

Pour aller plus loin :

Travailler avec les tableaux Zone de recherche Contraintes de recherche supplémentaires