Les propriétés d’un élément Static Text
Afficher la boîte de dialogue Properties, onglet Static Text
Afficher la boîte de dialogue Properties, onglet Static Text

- Search text le texte à rechercher dans l’image. Si vous devez rechercher une expression ou plusieurs mots et que vous savez qu’ils se trouveront toujours sur la même ligne, il est recommandé d’ignorer les espaces (c’est-à-dire de laisser l’option Take spaces into account décochée), car cela accélérera la recherche. Dans ce cas, vous pouvez saisir votre expression de recherche sans espaces — le programme les supprimera de toute façon si l’option Take spaces into account n’est pas sélectionnée.
| Ex. : | pour trouver le nom ‘Purchase Agreement’, qui est écrit sur une seule ligne dans tous les documents, vous devez saisir PURCHASEAGREEMENT. |
|---|
- Search text from database Vous pouvez rechercher dans l’image un fragment de texte provenant d’une base de données. Une requête SQL commençant par la commande SELECT est utilisée pour rechercher les champs pertinents dans la table. Le programme recherchera dans l’image le texte contenu dans le champ trouvé.
-
Saisissez la connection string de la base de données dans les champs Connection string ou cliquez sur
pour ouvrir la boîte de dialogue standard de connexion à la base de données.
- Saisissez votre requête dans le champ Query text. Vous pouvez également cliquer sur
pour ouvrir une fenêtre de saisie distincte dans laquelle vous pouvez saisir votre requête.
- Saisissez votre requête dans le champ Query text. Vous pouvez également cliquer sur
- Search text from file Vous pouvez rechercher un fragment de texte à partir d’un fichier. Cliquez sur le bouton Browse… pour sélectionner le fichier souhaité. Pour plus de détails sur l’utilisation des bases de données et des fichiers, consultez Utilisation des bases de données et des fichiers texte dans le langage FlexiLayout.
- Max number of errors
- le nombre maximal d’erreurs dans le mot. Le programme vérifiera chaque mot de l’expression si les mots de l’expression sont séparés par des espaces. Sinon, l’expression sera considérée comme ne contenant qu’un seul mot. Si le nombre d’erreurs dans un mot est supérieur au nombre spécifié dans ce champ, le mot est considéré comme non détecté. Une erreur correspond à une opération de suppression, d’insertion ou de remplacement requise pour que le texte corresponde à celui saisi dans le champ Search text. Par défaut, la valeur de cette propriété est illimitée.
| Ex. : | Supposons que le champ Search text contienne le mot ‘meet’ et que le nombre maximal d’erreurs soit défini sur 1. Si le programme trouve le mot ‘moot’ dans cette zone de recherche, il y aura 2 erreurs dans le mot et le mot ‘meet’ sera considéré comme non trouvé. |
|---|
- Pourcentage d’erreur maximal pourcentage maximal d’erreurs dans un mot (calculé comme le rapport entre le nombre d’erreurs dans les hypothèses et le nombre de lettres de l’hypothèse). Si le pourcentage d’erreurs dans un mot est supérieur à la valeur spécifiée dans ce champ, le mot est considéré comme non détecté. La valeur par défaut est de 30 %. Remarque. Si vous spécifiez à la fois le nombre maximal d’erreurs et le pourcentage maximal d’erreurs, le programme appliquera le critère le plus strict et ignorera l’autre.
- Longueur maximale de l’espace vous permet de spécifier la longueur maximale de l’espace à l’intérieur de l’objet détecté.
- Mots entiers uniquement recherche uniquement des mots entiers.
- Respecter la casse active la recherche sensible à la casse (le programme distingue les lettres minuscules des majuscules).
- Take spaces into account autorise les espaces dans la chaîne de recherche. Si cette option n’est pas sélectionnée, les espaces seront supprimés de la chaîne de recherche. Ignorer les espaces accélère la recherche. Toutefois, si votre expression de recherche peut se trouver sur plusieurs lignes ou si certains mots de l’expression peuvent être absents, vous devez activer l’option Take spaces into account et saisir votre expression de recherche en conservant les espaces.
- Autoriser plusieurs lignes - permet d’écrire l’expression sur plusieurs lignes.
- Pénalité de saut de ligne - définit une pénalité pour les retours à la ligne entre les mots. La pénalité est un nombre compris entre 0 et 1. La qualité de l’hypothèse sera multipliée par ce nombre autant de fois qu’il y a de retours à la ligne dans l’expression. Si les retours à la ligne sont autorisés dans l’expression, définissez ce paramètre sur 1 (multiplier la qualité de l’hypothèse par 1 ne dégradera pas sa qualité).
- Autoriser les mots manquants - permet que des mots soient absents de l’expression.
- Pénalité de mot manquant - définit une pénalité pour les mots manquants. La pénalité est un nombre compris entre 0 et 1. La qualité de l’hypothèse sera multipliée par ce nombre autant de fois qu’il y a de mots manquants dans l’expression. Si certains mots peuvent être absents de l’expression, définissez ce paramètre sur 1 (multiplier la qualité de l’hypothèse par 1 ne dégradera pas sa qualité).
Recommandations pour créer un élément Static Text
- pour vous assurer que le texte statique sélectionné peut être reconnu de façon fiable sur toutes les images, affichez les résultats de la pré-reconnaissance sur toutes les images en cliquant sur
ou
pour les mots et les groupes de mots, respectivement. Assurez-vous que les lettres sont correctement regroupées en mots et que les mots sont correctement regroupés en lignes. - Il est préférable de sélectionner un texte statique imprimé en gros caractères, qui reste identique même sur des numérisations de mauvaise qualité ou pour lequel le nombre d’erreurs d’OCR est prévisible.
- S’il n’y a dans les documents qu’un texte statique en petits caractères qui ne peut pas être reconnu de manière fiable lors de la pré-reconnaissance (c’est-à-dire si le nombre et le type d’erreurs varient fortement d’une image à l’autre), il est préférable de décrire ces fragments de texte non pas comme Static Text, mais comme Object Collection avec les options Text et Punctuation mark sélectionnées. (Il se peut également que vous deviez sélectionner l’option Picture - cliquez sur
(Raw Objects ) dans la barre d’outils, puis sélectionnez l’objet correspondant sur l’image. Le type de l’objet s’affichera sur la ligne DataType dans la fenêtre Properties.) - Il est préférable de sélectionner des fragments de texte statique uniques afin d’éviter les correspondances erronées et de réduire au minimum les contraintes de recherche supplémentaires.
- S’il existe à la fois des noms d’un seul mot (que vous prévoyez de trouver au moyen d’éléments Static Text) et des noms composés de plusieurs mots contenant les mêmes mots que ces noms d’un seul mot, créez d’abord des éléments pour les expressions. Cela évitera que le programme ne détecte à tort des noms d’un seul mot à l’intérieur de noms composés de plusieurs mots.
Recommandations pour les langues hiéroglyphiques
Pour ces langues, la recherche d’un mot entier n’est pas disponible, car les textes rédigés dans ces langues ne sont souvent pas explicitement séparés en mots.
