Passer au contenu principal
Cet article décrit les différents types de normalisation qui peuvent être utilisés lors de l’ajout de colonnes issues d’une base de données externe à un jeu de données dans une Document Definition FCFORINVOICES, ainsi que les paramètres associés à ces types de normalisation. La normalisation permet de modifier le format de valeurs écrites différemment mais ayant essentiellement la même signification. Elle impose un format cohérent aux valeurs afin de pouvoir les comparer. Par exemple, l’adresse et le nom d’une entreprise peuvent être écrits de différentes façons. Comme ces valeurs renvoient à la même entreprise et à la même adresse, elles doivent être normalisées pour permettre au programme d’effectuer une comparaison correcte. Le type de normalisation peut être spécifié pour chaque colonne d’un jeu de données lors de la mise en correspondance de ces colonnes avec celles d’une base de données externe. La normalisation s’applique uniquement aux valeurs stockées dans le jeu de données (l’option Cache data doit être activée dans les propriétés du jeu de données). Les valeurs de la base de données externe ne seront pas modifiées.
FCFORINVOICES propose deux types de normalisation pour les valeurs du jeu de données.

1. Texte

Ce type de normalisation est utile pour comparer des chaînes de caractères telles que des noms d’entreprise et des adresses.
  1. Les espaces blancs (y compris les caractères de saut de ligne et de tabulation) et les symboles de séparation sont remplacés par des espaces ordinaires.
  2. Les points utilisés comme séparateurs (c’est-à-dire les points placés entre les mots) sont remplacés par des espaces, et les points dans les abréviations sont supprimés.
  3. Normalisation des symboles de conjonction (&, +, -, /, ~) :
    • Les groupes de mots qui commencent par un mot d’une seule lettre et sont séparés par le même symbole de conjonction sont fusionnés en un seul mot ; par exemple, R & D devient R&D ;
    • Dans tous les autres cas, les symboles de conjonction sont remplacés par des espaces ; par exemple, Procter&Gamble devient Procter Gamble.
  4. Les doubles espaces sont supprimés.
  5. Une liste prédéfinie est utilisée pour scinder les mots. Par exemple, CoKG est scindé en Co KG.
  6. Les espaces dans le texte reconnu sont utilisés pour le scinder en mots distincts.
  7. Une liste prédéfinie est utilisée pour remplacer les suffixes dans chaque mot. Par exemple, vous pouvez remplacer le suffixe strasse par le suffixe str.
  8. Les suites de mots sont automatiquement remplacées selon une liste prédéfinie. Par exemple, vous pouvez remplacer le mot Limited par l’abréviation Ltd.
Les paramètres de normalisation sont définis dans le fichier Normalization.xml, stocké dans le dossier du projet.
Le fichier Normalization.xml peut être modifié après la création du jeu de données (séparément pour chaque jeu de données). Pour modifier les paramètres de normalisation standard, procédez comme suit :
  1. Téléchargez le fichier de paramètres à l’aide de la commande FCAdminTools DownloadNormalizationSettings.
  2. Apportez les modifications nécessaires.
  3. Téléversez le fichier de paramètres à l’aide de la commande FCAdminTools UpdateNormalizationSettings.
Important ! Après avoir mis à jour le fichier de paramètres, vous devez mettre à jour le jeu de données. Pour plus d’informations, voir Mise à jour des jeux de données.
Des modifications importantes pourront être apportées à l’algorithme de normalisation dans les futures versions du programme.

2. Code alphanumérique

Ce type de normalisation est utile pour comparer des codes alphanumériques tels que les numéros d’identifiant fiscal, les comptes bancaires et les codes postaux. Tous les caractères, à l’exception des chiffres et des lettres, sont supprimés des valeurs, ce qui vous permet de les comparer en ignorant les espaces, les tirets, les barres obliques et autres caractères arbitraires qu’elles peuvent contenir. Lorsque la normalisation est appliquée, l’option Store normalized value devient disponible lors de la mise en correspondance de la colonne du jeu de données à une colonne d’une base de données externe.
  • Lorsque cette option est activée, les valeurs normalisées sont stockées dans le jeu de données.
  • Lorsque cette option est désactivée, les valeurs d’origine de la base de données externe sont copiées dans le jeu de données.
Cette option n’affecte ni l’extraction de données ni les vérifications automatisées, mais elle détermine la valeur qui sera affichée à l’utilisateur lorsque celui-ci recherche une entrée dans un dictionnaire.