Metodo
Caratteri
Impostazione di un set di caratteri
- Selezionare lo standard di codifica dei caratteri appropriato dagli elenchi a discesa nel field Code Page o nel field Unicode Subrange.
- Selezionare i caratteri appropriati nella tabella sottostante.
- I caratteri selezionati verranno visualizzati nel field Selected characters. È inoltre possibile specificare un set di caratteri tramite tastiera.
- Nel field
Portion in text, %, specificare la percentuale di caratteri (da 0 a 100) presenti nel testo da cercare.

Espressione regolare
Alfabeto delle espressioni regolari
| Nome nell’elenco | Simbolo nel field | Esempio | ||
|---|---|---|---|---|
| Qualsiasi carattere | * | “k”*“t” – consente ‘kit’, ‘kat’, ecc. | ||
| Lettera | C | C”at” – consente cat, bat, Rat, mat, ecc. | ||
| Lettera maiuscola | A | A”at” – consente Cat, Bat, Rat, Mat, ecc. | ||
| Lettera minuscola | a | a”at” – consente car, bat, rat, mat, ecc. | ||
| Lettera o cifra | X | X – consente qualsiasi singola lettera o cifra. | ||
| Cifra | N | N”th” – consente 5th, 4th, 6th, ecc. | ||
| string | "" | "cat” | ||
| Oppure | ”dr”(“i" | "u”)“nk” – consente “drink” oppure “drunk”. | ||
| Carattere dall’insieme | [] | [hm]“at” – consente ‘hat’ oppure ‘mat’. | ||
| Carattere non appartenente all’insieme | [^] | [^b]“at” – consente ‘cat’, ‘mat’, ‘rat’, ma non consente bat. | ||
| Qualsiasi numero di ripetizioni (si applica all’espressione o sottoespressione a sinistra) | {-} | [AB74]{-} – consente qualsiasi combinazione di A, B, 7, 4 di qualsiasi lunghezza. | ||
| Numero di ripetizioni pari a n | {n} | N{2}"th" – consente 25th, 84th, 11th, ecc. | ||
| Da n a m ripetizioni | {n-m} | N{1-3}"th" – consente 5th, 84th, 111th, ecc. | ||
| Da 0 a n ripetizioni | {-n} | N{-2}"th" – consente th, 84th, 4th, ecc. | ||
| n o più ripetizioni | {n-} | N{2-}"th" – consente 25th, 834th, 311th, 34576th, ecc. | ||
| Sottoespressione | () |
Esempi di espressioni regolari
-
Codice postale:
[0-9]{6}Esempio: “142172” -
CAP (USA):
[0-9]{5}("-"[0-9]{4}){-1}Esempi: “55416”, “33701-4313” -
Reddito: N
{4-8}[,]N{2}Esempi: “15000,00”, “4499,00” -
Mese in formato numerico:
((|"0")[1-9])|("10")|("11")|("12")Esempi: “4”, “05”, “12” -
Numero frazionario:
("-"|)([0-9]{1-})(|(("."| ",")([0-9]{1-})))Esempi: “1234,567”, “0.99”, “100,0”, “-345.6788903” -
E-mail:
[A-Za-z0-9_]{1-}(("."| "-")[A-Za-z0-9_]{1-}){-3}"@"[A-Za-z0-9_]{1-}(("."| "-")[A-Za-z0-9_]{1-}){-4}"."([A-Za-z]{2-4}|"asia"|"museum"|"travel"|"example"|"localhost")Esempi: “support@abbyy.com”, “my-name@company.org.ru”, “info@gallery.museum”
Espressioni regolari estese
[% e %]). Le espressioni regolari estese offrono le seguenti funzionalità aggiuntive:
-
Uno o più caratteri all’interno delle parentesi vengono integrati con gli errori OCR più comuni.
Ad esempio,
[%S%]può consentire S, $ e 5. -
Parole speciali all’interno di
[%...%]per insiemi di caratteri comuni ed errori tipici di OCR: a. LETTERS - Lettere latine maiuscole e caratteri comunemente riconosciuti come tali; b. DIGITS - Cifre e caratteri comunemente riconosciuti come cifre; c. LETTERSANDDIGITS - Lettere latine maiuscole, cifre e caratteri comunemente riconosciuti come lettere latine maiuscole o cifre.
[%DIGITS%]{9} indica nove cifre consecutive o errori OCR comuni per le cifre, ad es. “OI234Sb7B9”.
Proprietà aggiuntive
- Errori consentiti specifica la percentuale massima di errori di riconoscimento ammessa. In altre parole, indica la percentuale massima del totale dei caratteri che può appartenere a caratteri non inclusi nel set definito. Un’ipotesi per un oggetto può essere formulata solo se la sua percentuale di errori di riconoscimento non supera il valore specificato.
- Conteggio parole specifica il numero minimo e massimo di parole nel testo da cercare.
- Conteggio caratteri specifica il numero minimo e massimo di caratteri nel testo da cercare.
- Ricerca di parti di parole specifica se i frammenti di parola sono consentiti nelle ipotesi. Disattiva questa opzione se devi escludere le ipotesi con frammenti di parola e cercare solo parole intere.
Proprietà avanzate
- Consenti ipotesi annidate consente di usare i caratteri nell’area di ricerca per generare tutte le possibili ipotesi, incluse quelle intersecanti e annidate.
- Lunghezza max. dello spazio consente di specificare la lunghezza massima dello spazio all’interno dell’oggetto rilevato.
- Orientamento del testo consente di specificare l’orientamento del testo che stai cercando. Per impostazione predefinita, l’attività cerca solo testo orientato orizzontalmente e non formulerà ipotesi per il testo ruotato. Se devi trovare il testo ruotato in un modo specifico e ignorare il testo scritto in qualsiasi altra direzione, seleziona solo l’opzione In senso orario o In senso antiorario. Per trovare il testo indipendentemente dal suo orientamento, abilita tutte le opzioni disponibili.
- Rileva parole per specifica come suddividere le righe in parole: automaticamente (Pre-Recognition) oppure suddividendo una riga in parole (Spazio interparola) ogni volta che lo spazio tra caratteri adiacenti è maggiore o uguale al valore inserito in Spazio interparola min..
