Vai al contenuto principale
Vantage può normalizzare i dati estratti per garantire uniformità nella loro rappresentazione. È possibile normalizzare i seguenti tipi di dati: Per normalizzare i dati estratti da un field, è necessario specificarne il tipo di dato. Per farlo:
  1. Nel modulo dati, fare clic sul pulsante accanto al field.
  2. Nella finestra di dialogo Opzioni field, selezionare il tipo di dato desiderato dall’elenco a discesa.
Affinché la normalizzazione funzioni, assicurarsi di selezionare le proprietà aggiuntive corrette per ciascun field, in modo che tutti i dati da normalizzare vengano estratti. È possibile modificare le proprietà aggiuntive di un field facendo clic sul pulsante Avanzate nella finestra di dialogo Opzioni field. Per ulteriori informazioni, vedere Proprietà aggiuntive del field di testo. Per visualizzare un valore normalizzato, posizionare il puntatore sul relativo field: Esempio di normalizzazione

Normalizzazione delle date

Le date estratte possono includere data e ora in qualsiasi formato. È possibile utilizzare i seguenti caratteri come separatori: il punto (.), lo spazio ( ), il trattino (-), la barra rovesciata () e la barra (/). Durante la normalizzazione delle date, Vantage converte le date estratte in un formato ISO 8601 standard:
  • YYYY-MM-DD per le date: anno, mese, giorno.
  • HH:MM:SS per l’ora: ore, minuti, secondi.

Esempi di date normalizzate

Dati estrattiDati normalizzati
15.06.20232023-06-15
2023/06/15 22:172023-06-15 22:17:00
06-15-20232023-06-15
02/11/20222022-02-11 oppure 2022-11-02
Nota: Se per la data sono abilitati sia i formati Day-Month-Year sia Month-Day-Year, Vantage potrebbe non essere in grado di normalizzarla in modo univoco. In tal caso, verrà proposta una scelta tra due date possibili.
Saturday, December 3rd, 20222022-12-03
The second of May 20222022-05-02
Nota: Le date scritte in lettere verranno normalizzate solo se in inglese e se l’inglese è selezionato nelle impostazioni della Skill.
Vantage potrebbe non essere in grado di normalizzare le date per uno dei seguenti motivi:
  • La data è incompleta, ad esempio: “4:39 am” (i valori dell’ora verranno normalizzati solo se estratti insieme alla relativa data).
  • Vengono usati avverbi di tempo invece di date esatte, ad esempio: “il mese scorso”, “qualche giorno fa”.
  • Sono presenti parole o caratteri aggiuntivi accanto alla data o all’ora, ad esempio: “2016/06/15 22”.
  • Vengono utilizzate rappresentazioni di data non comuni, ad esempio: “14 Jumada Al-Awwal 1445”.

Normalizzazione dei numeri

I numeri estratti possono contenere cifre, separatori decimali e il simbolo di percentuale (%). Possono essere utilizzati come separatori decimali i seguenti caratteri: il punto (.), la virgola (,), il trattino (-), il segno di uguale (=) e lo spazio ( ). Possono essere utilizzati come separatori delle migliaia (milioni, ecc.) i seguenti caratteri: il punto (.), la virgola (,), l’apostrofo (’) e lo spazio ( ). È possibile normalizzare i numeri che utilizzano i sistemi di raggruppamento delle cifre occidentale o indiano. Il sistema occidentale raggruppa le cifre a gruppi di tre, da destra a sinistra, utilizzando la virgola per separare migliaia e milioni. Anche il sistema indiano utilizza la virgola: raggruppa dapprima le prime tre cifre da destra, quindi procede raggruppando le cifre a due a due per decine di migliaia, lakh, decine di lakh, crore, decine di crore e così via. Durante la normalizzazione dei numeri in uno dei due sistemi di numerazione, Vantage analizza le stringhe di dati numerici estratti e le converte nel formato standardizzato mostrato nella tabella seguente, utilizzando il punto (.) per separare la parte intera da quella frazionaria.

Esempi di numeri normalizzati

Dati estrattiDati normalizzati
12,345,67812345678
-12,345.678-12345.678
12.000012
1.0001000 o 1
Suggerimento: Se la parte dopo il punto ha tre cifre, è necessario scegliere uno dei due valori possibili, stabilendo se il punto separa le migliaia oppure la parte intera da quella decimale.
12,345.678 %12345.678
1,23,45,67,890 (sistema di numerazione indiano)1234567890
twenty-first21
Nota: I numeri scritti in lettere verranno normalizzati solo se scritti in inglese e se è selezionato l’inglese nelle impostazioni della skill. Vantage potrebbe non riuscire a normalizzare i numeri per uno dei seguenti motivi:
  • Parole o caratteri aggiuntivi compaiono accanto al numero, ad esempio: “EURO12,345.678” o “5 kilos”.
  • È presente un numero irregolare di cifre tra le parti decimali e intere, o tra le parti decimali e delle migliaia, ad esempio: “123,456,7890”. In questo caso, la parte decimale deve contenere 3 cifre o meno. Inoltre, se viene estratto “123,456,789”, il valore normalizzato sarà “123456789” e se viene estratto “123,456,78”, il valore normalizzato sarà “123456.78”.
  • Vengono utilizzate rappresentazioni numeriche irregolari.

Normalizzazione degli importi in denaro

Un importo in denaro può includere sia un valore numerico sia un simbolo di valuta. Il simbolo di valuta può essere posto prima o dopo l’importo. Durante la normalizzazione degli importi in denaro, Vantage analizza le stringhe monetarie estratte (ad esempio simboli di valuta, decimali o separatori delle cifre) e le converte in un formato di valuta standardizzato, garantendo uniformità nei simboli di valuta e nei separatori decimali: il simbolo di valuta viene per primo, seguito dall’importo normalizzato come numero. Vantage può identificare le valute di diversi paesi, indicate in modi differenti (ad esempio, l’euro può essere rappresentato da E, €, o “euro”). Il valore normalizzato della valuta corrisponderà esattamente al simbolo o al nome della valuta presente nel testo estratto.

Esempi di importi monetari normalizzati

Dati estrattiDati normalizzati
12,345.678 EUROEURO 12345.678
12,345.678 ¥¥ 12345.678
13,87EE 13.87
13 euro 87euro 13.87
fifty dollarsdollars 50
₹1,23,455₹ 123455
Nota: Gli importi scritti in lettere verranno normalizzati solo se sono in inglese e se l’inglese è selezionato nelle impostazioni della skill.
Vantage potrebbe non riuscire a normalizzare gli importi monetari se vengono utilizzate parole non valide per indicare una valuta, ad esempio: “12 ttt”.

Vedi anche

field di tipo Testo