Hypothèse de chaîne de caractères

Parameter	Description
`String Value()`	La valeur du texte sur l’image à l’intérieur de la région de l’hypothèse.

Le programme prend en compte tous les objets texte qui intersectent horizontalement la zone de recherche (verticalement, les objets doivent tenir entièrement dans la zone de recherche). Les objets texte sont ensuite regroupés en lignes. Les lignes sont construites de gauche à droite. Le programme cesse de construire une ligne lorsque la longueur maximale d’espace (définie dans la propriété Max. space length) est dépassée. Dans les lignes obtenues, le programme identifie des chaînes de caractères, chacune ne contenant que des caractères issus d’un des jeux de caractères définis par l’utilisateur. De manière similaire, le programme divise les lignes en fragments. Ensuite, le programme formule une hypothèse pour chacun des fragments. Selon que Allow embedded hypotheses est sélectionné ou non, les hypothèses sont formulées selon deux principes différents. Supposons que le programme ait détecté trois fragments à l’étape précédente. Si Allow embedded hypotheses est sélectionné, les hypothèses sont formulées comme suit : hypothèse 1 : fragment 1 hypothèse 2 : fragment 1 + fragment 2 hypothèse 3 : fragment 1 + fragment 2 + fragment 3 hypothèse 4 : fragment 2 hypothèse 5 : fragment 2 + fragment 3 hypothèse 6 : fragment 3 Pour chaque hypothèse, le programme vérifie que la proportion de caractères de chaque jeu de caractères ne dépasse pas la valeur définie dans le champ Portion in text, %. De même, le programme vérifie que le pourcentage de caractères non alphabétiques ne dépasse pas la valeur définie dans le champ Allowed errors. Si au moins un des contrôles échoue, aucune hypothèse n’est formulée. Si Allow embedded hypotheses n’est pas sélectionné, les hypothèses imbriquées de la liste ci-dessus sont écartées. Les hypothèses imbriquées sont celles qui sont contenues dans une autre hypothèse de la liste ci-dessus. Si les contrôles sont concluants pour toutes les hypothèses, seule l’hypothèse suivante reste : fragment 1 + fragment 2 + fragment 3. Ainsi, si Allow embedded hypotheses n’est pas sélectionné, le programme formule des hypothèses de longueur maximale qui satisfont toutes les conditions. Même si les hypothèses imbriquées sont exclues, des hypothèses peuvent se chevaucher. Il peut s’agir d’un caractère ou d’un mot isolé, ou d’une chaîne de caractères faisant partie d’autres hypothèses mais pour laquelle aucune hypothèse distincte n’a été formulée. Par exemple, le programme peut formuler deux hypothèses (c.-à-d. deux chaînes) — l’une se terminant par un certain mot ou une certaine expression et l’autre commençant par ce mot ou cette expression. Par ex. : hypothèse 1 : fragment 1 + fragment 2 hypothèse 2 : fragment 2 + fragment 3 Une fois que toutes les hypothèses possibles ont été générées, le programme calcule la qualité de la condition de recherche pour chacune (estimation du degré de conformité d’une hypothèse aux contraintes de recherche définies dans Search Conditions). À ce stade, la qualité est calculée en fonction de la conformité de la longueur de l’hypothèse (en caractères) à l’intervalle flou spécifié dans la propriété Character count, de la conformité de la longueur de l’écart total dans la ligne à l’intervalle flou spécifié dans TotalGapLength, et de la conformité du nombre de mots dans la ligne à l’intervalle flou spécifié dans Word count. La qualité globale d’une hypothèse est calculée en multipliant toutes les qualités.

Hypothèse de collection d’objets

Hypothèse de texte statique

⌘I