Vai al contenuto principale
Puoi aggiungere un field di testo eseguendo una delle seguenti operazioni:
  • Specifica una regione del field sull’immagine del documento facendo clic sul valore di un field (evidenziato in verde al passaggio del mouse) oppure delimitando un’area rettangolare attorno al valore del field. Dopo di ciò, il nuovo field apparirà nel modulo dati. Puoi modificare il nome del field facendo doppio clic su di esso nel modulo dati oppure facendo clic su di esso nelle proprietà del field. Puoi selezionare l’intero nome facendo triplo clic su di esso. Per aprire le proprietà del field, fai clic sul pulsante Field options.
  • Aggiungi un nuovo field al modulo dati facendo clic su Add Field sulla barra degli strumenti e quindi delimitando la regione del field sull’immagine. In questo modo, i dati rilevati all’interno della regione selezionata verranno impostati come valore del field nel modulo dati.
Puoi anche aggiungere nuove regioni di field di testo ai field esistenti nel modulo dati selezionando il field appropriato nel modulo dati e quindi facendo clic sulla sua posizione nell’immagine del documento. Se un field deve contenere più di una parola, seleziona più parole delimitando l’intera regione del field.

Aggiunta di un field di testo con più regioni

Alcuni field di testo richiedono più regioni in un singolo documento per i seguenti motivi:
  • Alcuni valori del field possono iniziare su una riga di testo e terminare su un’altra.
  • Alcuni valori del field possono iniziare su una Pagina e terminare su un’altra.
Per aggiungere un field di testo con più regioni, procedi come segue:
  • Aggiungi un field utilizzando uno dei metodi descritti sopra.
  • Tieni premuto il tasto Shift e seleziona regioni aggiuntive per il field aggiunto.
Le regioni di un field di testo possono anche essere contrassegnate:
  • Su Pagine diverse
  • All’interno di un’altra regione di un field (in questo caso, la regione interna verrà evidenziata con un colore più scuro e, se è attiva, verrà evidenziata in giallo).

Proprietà generali del field di testo

  • Nome del Field. Il nome univoco del field in una specifica skill. Il nome del field non può contenere caratteri speciali come punti, virgole, barre, due punti, asterischi, punti interrogativi, virgolette, segni di minore, segni di maggiore o barre verticali. La lunghezza massima consentita per un nome di field è di 90 caratteri.
  • Tipo di dati. Il tipo di dati contenuto in un field. Si tratta di un Parameter cruciale del field di testo, poiché influisce sulla precisione del riconoscimento. Ogni tipo di dati ha il proprio set di restrizioni per il valore del field, riducendo i possibili valori per un carattere e rendendo l’estrazione dei dati più accurata.
Tipo di datiDescrizione
TextPuò contenere lettere latine e cirilliche, cifre, ideogrammi e caratteri speciali.
DateData e ora in qualsiasi formato. I seguenti caratteri possono essere utilizzati come separatori: il punto (.), lo spazio ( ), il trattino (-), la barra rovesciata () e la barra (/).
NumberPuò contenere cifre, separatori decimali e il simbolo di percentuale (%). I seguenti caratteri possono essere utilizzati come separatori decimali: il punto (.), la virgola (,), il trattino (-), il segno di uguale (=) e lo spazio ( ). I seguenti caratteri possono essere utilizzati come separatori delle migliaia: il punto (.), la virgola (,), l’apostrofo (’) e lo spazio ( ).
MoneyContiene sia un valore numerico sia un simbolo di valuta. Il simbolo di valuta può essere posto prima o dopo l’importo.
Esempio: La lettera minuscola “l” (L), la lettera maiuscola “I” (i) e la cifra “1” possono avere un aspetto simile. Se un carattere con questo aspetto viene rilevato in un field Number o in un field Currency Amount, verrà riconosciuto come “1”, poiché i field di questo tipo non possono contenere lettere.
  • Consenti più elementi. Specifica se il field è ripetuto o meno. Le istanze dei field ripetuti possono fare riferimento a più oggetti dello stesso tipo, ad esempio nomi dei figli o numeri di conto.
  • Field obbligatorio. Specifica che il valore del field non può essere vuoto. L’abilitazione di questa proprietà aggiunge una regola di convalida alla Pagina. Se il field è vuoto dopo l’estrazione, il Document verrà inviato alla revisione manuale con un errore.
  • Field chiave. Specifica se il valore del field viene utilizzato per cercare documenti.
  • Field dimensione. Specifica se il valore del field viene utilizzato per ottenere informazioni dettagliate sulle transaction della skill in Skill Monitor.

Aspetto del testo

Questo gruppo di proprietà si riferisce all’aspetto dei caratteri previsti nel field.
  • Origine del testo. Specifica se il field può contenere solo caratteri stampati, solo caratteri scritti a mano o entrambi. Se aggiungi un field selezionando un’area rettangolare nel documento, il valore di questa proprietà viene impostato in base ai caratteri rilevati in quell’area. Se aggiungi un field facendo clic su Add Field, il valore di questa proprietà è impostato su Printed per impostazione predefinita.
Puoi trovare un elenco di tutte le lingue per le quali è supportato il riconoscimento del testo scritto a mano qui.
Nota: Il riconoscimento del testo scritto a mano è abilitato per impostazione predefinita per le nuove Document skill. Per disabilitarlo o riabilitarlo, fai clic sull’icona delle impostazioni della skill a destra del nome della skill, quindi vai alla scheda Languages e seleziona l’opzione Handwritten nella sezione Text Appearance.
  • Elimina sfondo del field. Questa opzione può essere utilizzata per migliorare l’accuratezza del riconoscimento se il field ha una cornice, caselle per singoli caratteri o testo segnaposto. Se abiliti questa opzione, devi caricare il documento del modulo in bianco che verrà utilizzato come modello per il riconoscimento dello sfondo e contrassegnare il field corrispondente sul modulo in bianco. Il documento del modulo in bianco appare nel Document Set ed è contrassegnato da un’icona.
  • Font speciali. Se si prevede che il field contenga testo digitato con un font specifico, puoi usare questa opzione per selezionare il tipo di font, migliorando l’accuratezza del riconoscimento. È possibile selezionare anche più font.

Tipi di carattere supportati

FontDescrizioneEsempio di font
FaxUn carattere tipicamente utilizzato dai fax.Fax Font
GothicTesti stampati in carattere gotico.Gothic Font
IndexUn set speciale di caratteri che include solo cifre nello stile dei codici postali (ZIP code).Index Font
Matrix printerTesti stampati con una stampante a matrice di punti.Matrix Font
MICR CMC-7Un carattere MICR specifico (CMC-7) utilizzato per codici a barre/marcature magnetiche.CMC-7 Font
MICR E-13BUn set speciale di caratteri numerici stampati con inchiostro magnetico. I caratteri MICR (Magnetic Ink Character Recognition) si trovano in vari documenti, inclusi gli assegni.E-13B Font
OCR-AUn carattere monospazio progettato per l’Optical Character Recognition (OCR). Ampiamente utilizzato da banche, società di carte di credito e aziende simili.OCR-A Font
OCR-BUn carattere progettato per l’Optical Character Recognition (OCR).OCR-B Font
ReceiptIl riconoscitore prevede testo di bassa qualità, per lo più in un carattere monospazio o normale tipico degli scontrini.Receipt Font
TypewriterTesti dattiloscritti.Typewriter Font

Proprietà aggiuntive del field di testo

Le proprietà aggiuntive dipendono dal tipo di dati specificato per il field.

Testo

Il gruppo di impostazioni Value:
  • Lunghezza massima. Il numero massimo consentito di caratteri nel field. Se il numero di caratteri nel valore estratto supera questa lunghezza, verrà visualizzato un messaggio di errore. Se nel processo è prevista una fase di revisione manuale, il Document verrà inviato alla revisione manuale.
  • Espressione regolare. L’opzione consente di aggiungere un’espressione regolare (ovvero una descrizione formale della struttura del valore del field). Un field configurato tramite un’espressione regolare può contenere lettere, cifre e altri caratteri come definiti nel modulo dati.
L’uso di un’espressione regolare può migliorare l’accuratezza dell’estrazione, ossia individuare schemi nel testo, influendo sul risultato dell’estrazione restringendo l’insieme dei caratteri validi. Ad esempio, se un field di testo contiene solo numeri, è possibile specificare un’espressione regolare che descriva la struttura del field come contenente solo cifre. In questo caso, durante il riconoscimento del field, il programma cercherà di riconoscere ogni carattere come cifra. È inoltre possibile specificare un’espressione regolare per uno specifico formato di numero di telefono (esempio 1), oppure verificare che il field contenga 2 parole e che una di esse sia un numero, ad esempio 50 lbs (esempio 2): Esempio 1 (per numeri di telefono come 1-(234)-567-8900 o 2 (987) 654 3211)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Esempio 2 (per valori di peso di 50lb/50lbs/50Lb/50Lbs/50 lb/50 lbs, ecc.)
/^[\d]*(\s)?(L|l)b(s)?$/
Nota: Le espressioni regolari non influiscono sul riconoscimento del testo di un documento PDF.

Data

Il gruppo di impostazioni Il valore può includere:
  • Ora. Selezionare questa opzione per i field Data che possono includere anche l’ora. Se un valore di ora non è consentito, non verrà estratto durante il riconoscimento.
  • Giorno della settimana. Questa opzione consente di indicare il giorno della settimana nel field Data. Se un valore del giorno della settimana non è consentito, non verrà estratto durante il riconoscimento.
  • Mese per nome. Questa opzione consente di indicare il mese in forma testuale.
Il gruppo di impostazioni Ordine accettabile dei componenti consente di selezionare un formato data adeguato tra le seguenti opzioni: Giorno-Mese-Anno, Mese-Giorno-Anno e Anno-Mese-Giorno. È inoltre possibile specificare più formati contemporaneamente. Se il formato data rilevato non corrisponde a quelli specificati, il documento verrà inviato alla revisione manuale con un errore. Il gruppo di impostazioni Data accettabile consente di specificare un intervallo di date valide. È possibile definirlo selezionando un numero di mesi prima e dopo il giorno in cui il documento è stato elaborato. Il numero di mesi deve essere un intero. Una regola verifica se la data indicata rientra nell’intervallo specificato. In caso contrario, la regola mostrerà un errore e il documento verrà inviato alla revisione manuale.

Numero

Il gruppo di impostazioni Value consente di specificare che tipo di numero è il valore rilevato (intero o decimale), nonché quali formati numerici possono essere riconosciuti in questo field. Se il valore di questo field non soddisfa i requisiti specificati, il documento verrà inviato a revisione manuale.
  • Solo interi specifica che il valore può essere soltanto un numero intero. Se nel field viene rilevato un numero con un separatore mentre questa opzione è abilitata, questo verrà interpretato come separatore delle migliaia.
  • La parte frazionaria può contenere più di due cifre. Abilitare questa opzione se si prevede che la parte decimale del valore estratto abbia più di due cifre. I seguenti caratteri possono essere utilizzati come separatori decimali: punto (.), virgola (,), trattino (-), segno di uguale (=) e spazio ( ).
  • Può avere valori negativi. Questa opzione consente che il valore estratto sia negativo. I valori negativi possono essere indicati con un segno meno o tra parentesi.
  • Può includere il simbolo ’%’. Questa opzione consente che il valore estratto presenti il simbolo di percentuale prima o dopo il valore.
Il gruppo di impostazioni Number must be within interval consente di specificare un intervallo entro il quale il valore deve rientrare per essere considerato valido. L’intervallo viene definito specificando un valore minimo e uno massimo. Tali valori possono essere sia interi sia decimali; è possibile indicare anche valori negativi. Una regola verifica quindi se il valore rientra nell’intervallo specificato. In caso contrario, la regola visualizza un errore e il documento viene inviato a revisione manuale.

Denaro

Le proprietà di Denaro sono identiche a quelle di Numero, con la sola eccezione che il field Denaro non può contenere il carattere di percentuale.

Vedi anche