- Parcourez les images du lot.
- Essayez de repérer visuellement des objets présents sur la plupart des images et n’apparaissant qu’une seule fois sur chaque image. Ces objets seront créés au début de la création du FlexiLayout.
- Trouvez un objet (ou plusieurs objets) pouvant servir d’identifiant. Il peut s’agir du titre ou de tout autre objet permettant d’identifier sans ambiguïté le document comme appartenant à un type particulier. L’objet identifiant doit être présent dans tous les documents et, si possible, être reconnu sans erreur. Nous vous recommandons de marquer l’élément qui décrira l’objet identifiant comme élément obligatoire. Si le programme ne parvient pas à trouver l’objet correspondant à cet élément, la mise en correspondance du FlexiLayout s’arrêtera, ce qui signifiera que le document n’appartient pas au type de document décrit par le FlexiLayout
- Réfléchissez à l’ordre dans lequel vous créerez les éléments et à la manière dont ils seront organisés dans l’arborescence du FlexiLayout. L’ordre des éléments dans l’arborescence déterminera l’ordre dans lequel le programme recherchera les objets correspondants sur les images.
- Réfléchissez aux méthodes pouvant être utilisées pour trouver chacun des objets. Dans le FlexiLayout, ces méthodes seront décrites à l’aide des propriétés des éléments. Commencez par les objets les plus fiables, c’est-à-dire ceux qui sont présents sur la plupart des images et qui n’apparaissent pas trop souvent sur une même image. Ils pourront ensuite être utilisés comme points de départ, ou éléments de référence, pour rechercher des éléments moins fiables. Veillez à sélectionner les critères de recherche les plus stricts afin que le programme formule l’hypothèse la plus fiable. Pour éviter une croissance incontrôlée de l’arbre des hypothèses, nous vous déconseillons de modifier la valeur par défaut du champ Nombre d’hypothèses conservées.
- Envisagez de regrouper certains éléments dans des éléments Group. Les éléments Group sont pratiques pour tester des parties du FlexiLayout indépendantes les unes des autres. Par exemple, un FlexiLayout composé de 100 éléments au total peut ne comporter que 3 éléments Group au niveau le plus élevé : le titre, le corps et le bas du document. Chacun de ces trois éléments Group peut être composé d’éléments Group décrivant de plus petites portions du document. Un tel emboîtement des éléments Group réduit le nombre de combinaisons de recherche possibles et facilite le débogage du FlexiLayout, car vous pouvez travailler sur chaque partie du FlexiLayout indépendamment.
Pre-recognition
Analyse des images
Analysez les images du lot avant de créer un FlexiLayout : trouvez des objets d’ossature fiables, choisissez un identifiant et planifiez l’ordre et le regroupement des éléments.
Vous devez analyser les images du lot afin de trouver des objets pouvant constituer l’ossature de votre FlexiLayout, c’est-à-dire des objets présents sur toutes les images et que le programme peut détecter de manière fiable.
Une autre décision importante à prendre lors de l’analyse des images concerne l’ordre dans lequel décrire les objets, car cet ordre détermine l’ordre dans lequel le programme utilisera les éléments lors de la mise en correspondance du FlexiLayout avec les images.
Le scénario général est le suivant :
