Recherche de chaînes de chiffres

Un élément Character String est utilisé pour rechercher des chaînes de chiffres. Si la qualité de l’image est très bonne, il est possible de définir même une expression régulière comme alphabet. Cependant, si la qualité des images du lot varie, vous devez spécifier la liste des caractères susceptibles d’être reconnus dans le champ correspondant. Si la qualité des images ou de l’impression n’est pas satisfaisante, des chiffres peuvent être reconnus à tort comme d’autres caractères. Par exemple, 8 peut être reconnu comme B, 7 comme ?, 5 comme S et 4 comme H ou comme la combinaison de lettres LI. Cela peut se produire si les chiffres sont « collés », ce qui est fréquent lorsque les documents sont remplis à la machine à écrire.

Ajouter les caractères mal reconnus à l’alphabet

Le degré de correspondance entre les résultats de la reconnaissance et les caractères réels dépend de la qualité de l’image. S’il existe une tendance à mal interpréter les caractères sur tout ou partie des images traitées, vous devez ajouter ces variantes de reconnaissance à l’alphabet dans la fenêtre Modifier l’alphabet de l’élément Character String correspondant. En spécifiant ces caractères, vous indiquez à FlexiLayout Studio de ne pas pénaliser l’hypothèse si ces caractères sont rencontrés dans la zone de recherche.

Il n’est pas nécessaire de spécifier toutes les variantes de reconnaissance possibles. Si la qualité des images est mauvaise, trouver toutes ces variantes peut prendre énormément de temps.Si, en raison de la faible qualité des images, les résultats de la reconnaissance sont imprévisibles, vous devez lancer la recherche en utilisant d’autres propriétés de l’élément, telles que la longueur de la chaîne et la longueur des espaces dans la chaîne.

Spécifiez les caractères dont la forme est similaire à celle des chiffres. Le risque de reconnaissance incorrecte est plus élevé pour ces caractères que pour les autres. Vous pouvez également spécifier d’autres caractères s’ils sont souvent confondus avec des chiffres.

Capture d’écran de la fenêtre Modifier l’alphabet avec des chiffres et des caractères mal reconnus ajoutés à l’alphabet de l’élément Character String

Mise en correspondance avec un alphabet composé uniquement de chiffres

Considérez le projet 1.fsp (dossier Digital strings\Project1). Le projet comporte trois pages, chacune avec une erreur de reconnaissance différente :

Page	Erreur de reconnaissance
Page 1	Le chiffre `4` est reconnu comme la combinaison de lettres `LI`.
Page 2	La sous-chaîne `13` est reconnue comme la lettre `å`.
Page 3	Le chiffre `0` est reconnu comme `a`, `2` et `5` sont reconnus comme `S`, et `6` et `8` comme `B`.

Pour détecter la chaîne de chiffres, le projet utilise un élément Character String nommé DigitalString, dont l’alphabet ne contient que des chiffres. Le pourcentage maximal de caractères non numériques est défini à 20 %. Après avoir exécuté la procédure de mise en correspondance sur toutes les pages, le champ de chiffres de la page 3 n’a pas été entièrement détecté. La valeur de qualité de l’hypothèse est d’environ 0.98. Sur les pages 1 et 2, la chaîne a été détectée. Cependant, comme elle contient des caractères hors alphabet, les hypothèses correspondantes ont été pénalisées, et leur qualité est respectivement de 0.978 et 0.982.

Nouvelle mise en correspondance avec l’alphabet étendu

Examinons maintenant les résultats de la mise en correspondance lorsque les caractères reconnus à tort à la place des chiffres (L, I, e, a, B, S) sont ajoutés à l’alphabet. Le résultat de la mise en correspondance est visible dans le projet 2.fsp (dossier %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Digital strings\Project2). Les autres paramètres des projets sont identiques. Comme vous pouvez le voir, la chaîne de la page 3 a été entièrement détectée, et la qualité de toutes les hypothèses générées est de 1.

Propriété Optional d’un élément Group

Simplifier un FlexiLayout à l’aide d’un élément auxiliaire et d’une hypothèse nulle

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Recherche de chaînes de chiffres

Ajouter les caractères mal reconnus à l’alphabet

Mise en correspondance avec un alphabet composé uniquement de chiffres

Nouvelle mise en correspondance avec l’alphabet étendu

​Ajouter les caractères mal reconnus à l’alphabet

​Mise en correspondance avec un alphabet composé uniquement de chiffres

​Nouvelle mise en correspondance avec l’alphabet étendu

Ajouter les caractères mal reconnus à l’alphabet

Mise en correspondance avec un alphabet composé uniquement de chiffres

Nouvelle mise en correspondance avec l’alphabet étendu