Passer au contenu principal
Pour le mode de reconnaissance standard, spécifiez les éléments suivants :
  • ICR - Activez cette option si le champ contient du texte statique manuscrit ou en caractères d’imprimerie. Comme le style d’écriture peut varier considérablement d’un pays à l’autre, vous devez spécifier le pays approprié.
« 2 » russe
« 5 » standard (peut se rencontrer dans n’importe quel style)
« 5 » japonais
« 1 » russe
« 1 » allemand
« 9 » standard (peut se rencontrer dans n’importe quel style)
« 9 » tchèque (avec une boucle)
  • Reconnaissance optique de caractères (OCR) (imprimé) - Activez cette option si le champ contient du texte statique imprimé. Sélectionnez le style d’impression dans la liste déroulante (typographique, imprimante matricielle, machine à écrire, etc.). Voir aussi Types de texte pris en charge.
  • Avancé - Utilisez cette option pour sélectionner plusieurs types de texte ou pour spécifier un type de texte personnalisé. Cette option vous permet également de charger un fichier de motif au format PTN ou FBT. Pour charger un motif, cliquez sur Modify… Dans la boîte de dialogue qui s’ouvre, sélectionnez Use pattern et spécifiez le chemin du fichier.
Un motif est un ensemble de paires « image de caractère — caractère du clavier » créé par entraînement des motifs. Un motif utilisateur constitue une source d’informations supplémentaires pour le programme. L’entraînement des motifs est utile pour :
  • les textes en polices décoratives
    • les textes contenant des caractères inhabituels (par ex. des symboles mathématiques)
Remarque : Lors de l’utilisation d’un fichier de motif au format FBT :
  • Seuls les caractères reconnus de manière incertaine seront remplacés par les valeurs du fichier de motif lorsqu’un champ est reconnu.
    • Tous les caractères seront remplacés par les valeurs du fichier de motif lors de la reconnaissance du texte intégral.
Important ! L’entraînement des motifs n’est pas pris en charge pour les langues asiatiques.
  • Type de marquage - Sélectionnez le type de marquage ; pour faciliter votre choix, sélectionnez des exemples dans la liste déroulante. Si le marquage disparaît pendant la numérisation, votre type de marquage est à espacement fixe (Grey boxes). Si le marquage ne disparaît pas pendant la numérisation et est divisé en cellules pour les emplacements des caractères, vous devez saisir le nombre total de cellules. Lorsque le programme détecte automatiquement des champs avec ce type de marquage, le nombre de cellules est lui aussi déterminé automatiquement. Remarque : Pour certains types de marquage (Grey boxes, Simple et Underlined), les mots coupés en fin de ligne sont automatiquement reconstitués. Si le type de marquage sélectionné est Simple ou Underlined, les mots ne sont réunis que si un trait d’union a été utilisé pour les couper. Si le type de marquage Grey boxes est utilisé, les mots coupés sont détectés et réunis même si aucun trait d’union n’a été utilisé. Un mot est reconstitué s’il est détecté dans le dictionnaire.
  • Casse des lettres - Sélectionnez la casse des lettres dans le champ. Si des lettres minuscules et majuscules sont toutes deux possibles, laissez l’option Auto activée.
  • Orientation - Spécifiez l’orientation du texte.
  • Direction du texte CJK - Sélectionnez le sens de lecture à utiliser pour la Reconnaissance optique de caractères (OCR) des textes en chinois, japonais ou coréen. Les options possibles sont Auto, Horizontal Script ou Vertical Script. Auto est sélectionnée par défaut et constitue l’option recommandée pour les champs qui ne contiennent aucun texte CJK.
  • Une ligne - Sélectionnez cette option pour les champs qui se composeront toujours d’une seule ligne. L’utilisation de cette option garantit que le texte du champ ne sera jamais interprété comme du texte sur plusieurs lignes en raison d’une écriture mal reconnue ou de caractères de hauteur variable. Remarque : Désactivez cette option pour les champs sur plusieurs lignes.
  • Pour les champs dont la valeur se composera toujours d’un seul mot, activez l’option One word. Vous pouvez également activer cette option si vous souhaitez appliquer une expression régulière à l’ensemble du champ, quel que soit le nombre de mots qu’il contient. Remarque : Avec l’option One word activée, il n’est pas recommandé d’avoir des expressions contenant le caractère espace dans le dictionnaire personnalisé.
Spécifiez les paramètres de prétraitement de l’image :
  • Invert inverse les couleurs et la luminosité de l’image pendant la reconnaissance (cette inversion est temporaire et n’affecte que la reconnaissance ; les couleurs de l’image d’origine seront conservées dans le fichier de sortie).
    • Autodetect détecte automatiquement la couleur du texte et la couleur d’arrière-plan, et les inverse si nécessaire. Il s’agit du paramètre recommandé pour les documents contenant à la fois du texte clair sur fond sombre et du texte sombre sur fond clair.
    • Invert inverse complètement les images.
    • Don’t invert conserve les couleurs d’origine (cette option est activée par défaut).
  • Remove texture supprime la texture.
  • Suppression des taches parasites - Activez cette option pour supprimer les parasites de l’image.
  • Supprimer uniquement les parasites de la taille spécifiée - Activez cette option si vous souhaitez supprimer uniquement les parasites d’une taille donnée. Spécifiez la taille des parasites. Si cette option est désactivée et que l’option Suppression des taches parasites est activée, la taille des parasites sera sélectionnée automatiquement.