Vai al contenuto principale
L’elemento Character String presenta le seguenti proprietà nella sezione Cosa cercare:

Metodo

Method specifica il metodo di ricerca del testo. Sono disponibili i seguenti due metodi:

Caratteri

Caratteri descrive il testo utilizzando insiemi di caratteri specificati, ovvero raccolte di caratteri consentiti nella sequenza oggetto della ricerca. Questo metodo si usa quando il formato della sequenza di caratteri non può essere descritto con un’espressione regolare, oppure se la qualità dell’immagine non è sufficientemente alta e provoca errori di riconoscimento. È possibile specificare più insiemi di caratteri per un elemento Character String; tuttavia, tali insiemi non possono avere caratteri in comune. Se il formato del testo non è noto, non si specificano insiemi di caratteri consentiti e, durante la ricerca, vengono considerati tutti i caratteri possibili. Per impostare insiemi di caratteri, selezionare Caratteri nel campo Method e passare al campo Characters. Nella finestra di dialogo che si aprirà sarà possibile creare nuovi insiemi di caratteri, nonché modificarli o eliminarli.

Impostazione di un set di caratteri

  1. Selezionare lo standard di codifica dei caratteri appropriato dagli elenchi a discesa nel field Code Page o nel field Unicode Subrange.
  2. Selezionare i caratteri appropriati nella tabella sottostante.
  3. I caratteri selezionati verranno visualizzati nel field Selected characters. È inoltre possibile specificare un set di caratteri tramite tastiera.
  4. Nel field Portion in text, %, specificare la percentuale di caratteri (da 0 a 100) presenti nel testo da cercare.
CharacterSet

Espressione regolare

Espressione regolare descrive il testo da cercare tramite un’espressione regolare. Le espressioni regolari definiscono la struttura di una parola o di qualsiasi altro valore immesso utilizzando un linguaggio specifico. Un’espressione regolare determina le possibili combinazioni di caratteri e il loro posizionamento reciproco, descrivendo così la struttura del testo da cercare. Una ricerca con espressione regolare è precisa, cioè l’ipotesi formulata deve corrispondere esattamente all’espressione regolare. Di norma, questo metodo di ricerca si utilizza quando le immagini del documento sono di alta qualità e prive di errori di riconoscimento. Per descrivere il testo da cercare utilizzando un’espressione regolare, selezionare Espressione regolare nel field Method e andare al field sottostante. Nell’editor che si aprirà, specificare la propria espressione regolare.

Alfabeto delle espressioni regolari

Nome nell’elencoSimbolo nel fieldEsempio
Qualsiasi carattere*“k”*“t” – consente ‘kit’, ‘kat’, ecc.
LetteraCC”at” – consente cat, bat, Rat, mat, ecc.
Lettera maiuscolaAA”at” – consente Cat, Bat, Rat, Mat, ecc.
Lettera minuscolaaa”at” – consente car, bat, rat, mat, ecc.
Lettera o cifraXX – consente qualsiasi singola lettera o cifra.
CifraNN”th” – consente 5th, 4th, 6th, ecc.
string"""cat”
Oppure”dr”(“i""u”)“nk” – consente “drink” oppure “drunk”.
Carattere dall’insieme[][hm]“at” – consente ‘hat’ oppure ‘mat’.
Carattere non appartenente all’insieme[^][^b]“at” – consente ‘cat’, ‘mat’, ‘rat’, ma non consente bat.
Qualsiasi numero di ripetizioni (si applica all’espressione o sottoespressione a sinistra){-}[AB74]{-} – consente qualsiasi combinazione di A, B, 7, 4 di qualsiasi lunghezza.
Numero di ripetizioni pari a n{n}N{2}"th" – consente 25th, 84th, 11th, ecc.
Da n a m ripetizioni{n-m}N{1-3}"th" – consente 5th, 84th, 111th, ecc.
Da 0 a n ripetizioni{-n}N{-2}"th" – consente th, 84th, 4th, ecc.
n o più ripetizioni{n-}N{2-}"th" – consente 25th, 834th, 311th, 34576th, ecc.
Sottoespressione()

Esempi di espressioni regolari

  1. Codice postale: [0-9]{6} Esempio: “142172”
  2. CAP (USA): [0-9]{5}("-"[0-9]{4}){-1} Esempi: “55416”, “33701-4313”
  3. Reddito: N{4-8}[,]N{2} Esempi: “15000,00”, “4499,00”
  4. Mese in formato numerico: ((|"0")[1-9])|("10")|("11")|("12") Esempi: “4”, “05”, “12”
  5. Numero frazionario: ("-"|)([0-9]{1-})(|(("."| ",")([0-9]{1-}))) Esempi: “1234,567”, “0.99”, “100,0”, “-345.6788903”
  6. E-mail: [A-Za-z0-9_]{1-}(("."| "-")[A-Za-z0-9_]{1-}){-3}"@"[A-Za-z0-9_]{1-}(("."| "-")[A-Za-z0-9_]{1-}){-4}"."([A-Za-z]{2-4}|"asia"|"museum"|"travel"|"example"|"localhost") Esempi: “support@abbyy.com”, “my-name@company.org.ru”, “info@gallery.museum

Espressioni regolari estese

Le espressioni regolari estese sono espressioni regolari con funzionalità aggiuntive racchiuse tra una parentesi di apertura seguita da un carattere percentuale e un carattere percentuale seguito da una parentesi di chiusura ([% e %]). Le espressioni regolari estese offrono le seguenti funzionalità aggiuntive:
  1. Uno o più caratteri all’interno delle parentesi vengono integrati con gli errori OCR più comuni. Ad esempio, [%S%] può consentire S, $ e 5.
  2. Parole speciali all’interno di [%...%] per insiemi di caratteri comuni ed errori tipici di OCR: a. LETTERS - Lettere latine maiuscole e caratteri comunemente riconosciuti come tali; b. DIGITS - Cifre e caratteri comunemente riconosciuti come cifre; c. LETTERSANDDIGITS - Lettere latine maiuscole, cifre e caratteri comunemente riconosciuti come lettere latine maiuscole o cifre.
Ad esempio, [%DIGITS%]{9} indica nove cifre consecutive o errori OCR comuni per le cifre, ad es. “OI234Sb7B9”.

Proprietà aggiuntive

  • Errori consentiti specifica la percentuale massima di errori di riconoscimento ammessa. In altre parole, indica la percentuale massima del totale dei caratteri che può appartenere a caratteri non inclusi nel set definito. Un’ipotesi per un oggetto può essere formulata solo se la sua percentuale di errori di riconoscimento non supera il valore specificato.
  • Conteggio parole specifica il numero minimo e massimo di parole nel testo da cercare.
  • Conteggio caratteri specifica il numero minimo e massimo di caratteri nel testo da cercare.
  • Ricerca di parti di parole specifica se i frammenti di parola sono consentiti nelle ipotesi. Disattiva questa opzione se devi escludere le ipotesi con frammenti di parola e cercare solo parole intere.

Proprietà avanzate

  • Consenti ipotesi annidate consente di usare i caratteri nell’area di ricerca per generare tutte le possibili ipotesi, incluse quelle intersecanti e annidate.
  • Lunghezza max. dello spazio consente di specificare la lunghezza massima dello spazio all’interno dell’oggetto rilevato.
  • Orientamento del testo consente di specificare l’orientamento del testo che stai cercando. Per impostazione predefinita, l’attività cerca solo testo orientato orizzontalmente e non formulerà ipotesi per il testo ruotato. Se devi trovare il testo ruotato in un modo specifico e ignorare il testo scritto in qualsiasi altra direzione, seleziona solo l’opzione In senso orario o In senso antiorario. Per trovare il testo indipendentemente dal suo orientamento, abilita tutte le opzioni disponibili.
  • Rileva parole per specifica come suddividere le righe in parole: automaticamente (Pre-Recognition) oppure suddividendo una riga in parole (Spazio interparola) ogni volta che lo spazio tra caratteri adiacenti è maggiore o uguale al valore inserito in Spazio interparola min..
In modalità avanzata, le proprietà Conteggio parole e Conteggio caratteri non sono impostate con un valore numerico, ma con un intervallo fuzzy; per i dettagli, vedi Intervallo fuzzy e Editor intervallo fuzzy. Per visualizzare le proprietà avanzate, fai clic sull’icona della modalità avanzata nel riquadro Proprietà.