Passer au contenu principal
Un dictionnaire utilisateur est un dictionnaire auxiliaire créé par l’utilisateur et contenant des mots qui ne figurent pas dans les dictionnaires intégrés. Les dictionnaires intégrés peuvent être complétés par un dictionnaire utilisateur afin d’améliorer la qualité de la capture de données. En général, un dictionnaire utilisateur contient des termes spécialisés, des abréviations, des noms d’entreprise, etc. Vous pouvez configurer et activer des dictionnaires utilisateur dans l’onglet Langue de la boîte de dialogue Propriétés de préréconnaissance (pour ouvrir cette boîte de dialogue, ouvrez le menu FlexiLayout ou Classifier, cliquez sur Propriétés, puis sur le bouton Propriétés avancées de préréconnaissance…). Les dictionnaires utilisateur existants sont répertoriés dans le champ Dictionnaires utilisateur avec les informations suivantes :
  • Activé Indique si le dictionnaire utilisateur est utilisé.
  • Nom Nom du dictionnaire personnalisé.
  • Langue Langue du dictionnaire personnalisé.

Création et modification d’un dictionnaire personnalisé

Pour ajouter un dictionnaire personnalisé, cliquez sur le bouton Add… dans l’onglet langue de la boîte de dialogue propriété de préréconnaissance. Ensuite, dans la boîte de dialogue Add New Dictionary qui s’ouvre, spécifiez les propriétés suivantes :
  • Nom du dictionnaire Le nom du dictionnaire.
  • Méthode de définition Le type du dictionnaire :
    • Fichier de dictionnaire Ce type de dictionnaire repose sur un fichier DIC.
    • Expression régulière Ce type de dictionnaire repose sur une expression régulière.
Le type d’un dictionnaire ne peut pas être modifié après sa création.
  • Indépendant de la langue Si cette option est activée, le dictionnaire personnalisé sera utilisé avec tous les dictionnaires intégrés pour toutes les langues de reconnaissance activées. Le paramètre Language sera défini sur Neutral et il ne sera plus possible de modifier ce réglage. Cette option n’est disponible que pour les dictionnaires utilisateur de type Regular expression.
  • Langue (paramètres régionaux) La langue du dictionnaire peut être sélectionnée dans cette liste déroulante. La langue d’un dictionnaire ne peut pas être modifiée après sa création.
Lorsque vous cliquez sur le bouton OK, une boîte de dialogue contenant la liste de tous les paramètres modifiables et non modifiables s’affiche. Pour afficher les propriétés d’un dictionnaire, sélectionnez un dictionnaire, puis cliquez sur le bouton Edit. L’onglet General de la boîte de dialogue des propriétés d’un dictionnaire contient ses propriétés générales : le nom, le type, la langue et les éventuels commentaires utilisateur. Le nom d’un dictionnaire peut être modifié après sa création. L’onglet Dictionary de la boîte de dialogue des propriétés d’un dictionnaire contient des paramètres qui dépendent du type du dictionnaire et des paramètres de l’alphabet utilisateur.
  • Si vous sélectionnez le type Fichier de dictionnaire lors de la création du dictionnaire, cliquez sur le bouton et indiquez le chemin d’accès à un fichier DIC, ou créez un nouveau dictionnaire en cliquant sur Create new dictionary…. Si vous choisissez de créer un nouveau dictionnaire, indiquez son nom dans la boîte de dialogue Create New Dictionary File et cliquez sur OK, puis spécifiez ses paramètres dans l’éditeur.

Ajoute une valeur à un dictionnaire utilisateur.

Supprime la valeur actuellement sélectionnée dans la liste.

Importe des valeurs d’un fichier TXT ou DIC dans le dictionnaire utilisateur.

Remarque. Les signes de ponctuation (.,;:/*{}[]<>? etc.) servent de séparateurs entre les mots dans les dictionnaires. Si vous souhaitez utiliser ces symboles dans les mots du dictionnaire, placez la chaîne suivante au début du fichier texte : “DICTIONARY_PROPERTIES=USE_CONFIDENCE”. Dans ce cas, seuls les sauts de ligne seront traités comme séparateurs entre les mots. Dans ce cas, le nombre placé après le premier espace dans la chaîne indiquera le poids du mot, et tous les autres symboles seront ignorés.

Exporte les valeurs du dictionnaire vers un fichier TXT.

Ferme l’éditeur.

Lorsqu’un dictionnaire est créé, il est enregistré sous forme de fichier DIC dans le dossier du projet.
  • Si vous avez sélectionné le type de dictionnaire Expression régulière, spécifiez l’expression. Vous pouvez cliquer sur le bouton pour ouvrir un menu qui vous aidera à créer l’expression. Pour plus de détails, voir Alphabet utilisé dans les expressions régulières.
Les mots d’un dictionnaire utilisateur ont une priorité plus élevée que ceux d’un dictionnaire intégré. L’activation de l’option Prefer words from dictionary augmente encore cette priorité.

Alphabets utilisateur

Vous pouvez créer un alphabet utilisateur dans le groupe Alphabet de l’onglet Dictionary de la boîte de dialogue des propriétés d’un dictionnaire. Un alphabet utilisateur est un ensemble de caractères, de Separator, de préfixes et de suffixes pouvant être utilisés dans un dictionnaire utilisateur. Si un alphabet utilisateur est utilisé avec un dictionnaire utilisateur, les mots du dictionnaire qui contiennent des caractères ne figurant pas dans l’alphabet utilisateur sont considérés comme des mots hors dictionnaire. En d’autres termes, un alphabet utilisateur peut servir à limiter l’ensemble des caractères autorisés pour les dictionnaires personnalisés. Pour spécifier les caractères autorisés, activez l’option Utiliser un alphabet personnalisé, puis indiquez les symboles de l’alphabet dans la zone de texte ou à l’aide de l’Editor. Vous pouvez ouvrir l’Editor en cliquant sur le bouton Modifier. Pour spécifier les Separator, préfixes, suffixes et caractères ignorés (appelés collectivement signes de ponctuation dans cette section, par souci de simplicité), cliquez sur le bouton Paramètres avancés. Dans la boîte de dialogue paramètres avancés de l’alphabet personnalisé, spécifiez les signes de ponctuation.
  • Signes de ponctuation adjacents au début du mot Signes de ponctuation pouvant être accolés au début d’un mot, comme le trait de soulignement dans “_unknown”.
  • Signes de ponctuation adjacents à la fin du mot Signes de ponctuation pouvant être accolés à la fin d’un mot, comme l’esperluette dans “user&”.
  • Signes de ponctuation autonomes Signes de ponctuation pouvant apparaître isolément, comme la barre verticale dans “January |”
Vous pouvez spécifier les symboles que le programme doit ignorer lors de la vérification des mots par rapport au dictionnaire utilisateur dans le groupe d’options Caractères d’exclusion. Par exemple, si vous spécifiez l’expression régulière “+33NNNNNNNN et le trait d’union (-) comme caractère ignoré, le programme considérera “+33-11111111”, “+33-111-11-111” et “+33-111-111-11” comme des correspondances de l’expression régulière.