Passer au contenu principal
Vantage peut normaliser les données extraites afin d’en garantir une représentation uniforme. Les types de données suivants peuvent être normalisés : Pour normaliser les données extraites d’un champ, spécifiez son type de données :
1

Ouvrir les options du champ

Dans le formulaire de données, cliquez sur le bouton des paramètres du champ situé à côté du champ.
2

Sélectionner un type de données

Dans la boîte de dialogue Options du champ, sélectionnez le type de données dans la liste déroulante.
Pour que la normalisation fonctionne, définissez pour chaque champ les propriétés spécifiques au type de données afin que Vantage extraie tout ce qui doit être normalisé. Cliquez sur Avancé dans la boîte de dialogue Options du champ pour accéder à ces propriétés. Voir Propriétés par type de données.
Valeur normalisée affichée au survol d’un champ

Normaliser les dates

Lors de la normalisation des dates, Vantage convertit les dates extraites au format ISO 8601 :
  • YYYY-MM-DD pour les dates
  • HH:MM:SS pour l’heure
Pour les séparateurs acceptés, voir Types de données.

Exemples

Données extraitesDonnées normalisées
15.06.20232023-06-15
2023/06/15 22:172023-06-15 22:17:00
06-15-20232023-06-15
02/11/20222022-02-11 ou 2022-11-02
Saturday, December 3rd, 20222022-12-03
The second of May 20222022-05-02
Si les formats Jour-Mois-Année et Mois-Jour-Année sont tous deux activés, Vantage peut ne pas être en mesure de normaliser la date de façon non ambiguë. Dans ce cas, vous pouvez choisir entre les deux dates possibles.
Les dates écrites en toutes lettres ne sont normalisées que lorsqu’elles sont en anglais et que l’anglais est sélectionné dans les paramètres de la compétence. Vantage peut ne pas être en mesure de normaliser une date dans les cas suivants :
  • La date est incomplète — par exemple, 4:39 am (les heures ne sont normalisées que lorsqu’elles sont extraites avec une date).
  • Des adverbes de temps sont utilisés au lieu de dates exactes — par exemple, last month, a few days ago.
  • Des mots ou des caractères supplémentaires apparaissent à côté de la date ou de l’heure — par exemple, 2016/06/15 22.
  • Des formats de date peu courants sont utilisés — par exemple, 14 Jumada Al-Awwal 1445.

Normaliser les nombres

Vantage peut normaliser les nombres selon les conventions de groupement occidentales ou indiennes :
  • Occidental — Regroupe les chiffres par trois de droite à gauche, en utilisant des virgules pour séparer les milliers, les millions, et ainsi de suite.
  • Indien — Regroupe d’abord les trois chiffres de droite, puis les suivants par groupes de deux pour les dizaines de milliers, les lakhs, les dizaines de lakhs, les crores, et ainsi de suite.
Vantage analyse la chaîne extraite et la convertit dans un format standardisé en utilisant un point (.) pour séparer les parties entière et fractionnaire. Pour les séparateurs acceptés, voir Types de données.

Exemples

Données extraitesDonnées normalisées
12,345,67812345678
-12,345.678-12345.678
12.000012
1.0001000 ou 1
12,345.678 %12345.678
1,23,45,67,890 (système de numération indien)1234567890
vingt-et-unième21
Si la partie après le point comporte trois chiffres (comme dans 1.000), vous devez choisir entre les deux valeurs possibles, selon que le point sert de séparateur de milliers ou de séparateur décimal.
Les nombres écrits en toutes lettres ne sont normalisés que s’ils sont en anglais et que l’anglais est sélectionné dans les paramètres de la compétence. Vantage peut ne pas être en mesure de normaliser un nombre dans les cas suivants :
  • Des mots ou des caractères supplémentaires apparaissent à côté du nombre, par exemple EURO12,345.678 ou 5 kilos.
  • Le nombre de chiffres entre les parties entière et fractionnaire, ou entre les groupes de milliers et la partie décimale, est irrégulier, par exemple 123,456,7890. La partie fractionnaire doit contenir 3 chiffres ou moins. Si 123,456,789 est extrait, la valeur normalisée est 123456789 ; si 123,456,78 est extrait, la valeur normalisée est 123456.78.
  • Des formats de nombre irréguliers sont utilisés.

Normaliser les montants

Un montant contient une valeur numérique et un symbole de devise, placé avant ou après le montant. Lors de la normalisation, Vantage renvoie d’abord le symbole de devise, suivi du montant normalisé sous forme de nombre. La devise est identifiée par son symbole ou son nom — , EURO et euros correspondent tous à l’euro. La valeur normalisée utilise exactement le symbole ou le nom trouvé dans le texte extrait.

Exemples

Données extraitesDonnées normalisées
12,345.678 EUROEURO 12345.678
12,345.678 ¥¥ 12345.678
13,87EE 13.87
13 euro 87euro 13.87
fifty dollarsdollars 50
₹1,23,455₹ 123455
Les montants écrits en toutes lettres sont normalisés uniquement s’ils sont en anglais et si l’anglais est sélectionné dans les paramètres de la compétence.
Vantage peut ne pas être en mesure de normaliser un montant d’argent lorsque des mots non valides sont utilisés pour désigner une devise — par exemple, 12 ttt.