Ipotesi di stringa di caratteri - ABBYY Documentation

Parameter	Description
`String Value()`	Il valore del testo nell’immagine all’interno della regione dell’ipotesi.

Il programma considera tutti gli oggetti di testo che intersecano orizzontalmente l’area di ricerca (verticalmente gli oggetti devono rientrare interamente nell’area di ricerca). Gli oggetti di testo vengono quindi raggruppati in righe. Le righe sono formate da sinistra a destra. Il programma interrompe la costruzione di una riga quando viene superata la lunghezza massima dello spazio (impostata nella proprietà Max. space length). Nelle righe risultanti, il programma identifica stringhe di caratteri, ciascuna delle quali contiene caratteri provenienti da uno solo dei set di caratteri definiti dall’utente. Analogamente, il programma suddivide le righe in frammenti. Successivamente, il programma formula un’ipotesi per ciascun frammento. A seconda che l’opzione Allow embedded hypotheses sia selezionata o meno, le ipotesi vengono formulate secondo due principi diversi. Si supponga che il programma abbia rilevato tre frammenti nella fase precedente. Se l’opzione Allow embedded hypotheses è selezionata, le ipotesi sono formulate come segue: ipotesi 1: frammento 1 ipotesi 2: frammento 1 + frammento 2 ipotesi 3: frammento 1 + frammento 2 + frammento 3 ipotesi 4: frammento 2 ipotesi 5: frammento 2 + frammento 3 ipotesi 6: frammento 3 Per ciascuna ipotesi, il programma verifica che la quota di caratteri di ciascun set di caratteri non superi il valore impostato nel field Portion in text, %. Analogamente, il programma verifica che la percentuale di caratteri non alfabetici non superi il valore impostato nel field Allowed errors. Se almeno uno dei controlli non va a buon fine, non viene formulata alcuna ipotesi. Se l’opzione Allow embedded hypotheses non è selezionata, le ipotesi incorporate nell’elenco sopra verranno scartate. Le ipotesi incorporate sono quelle contenute all’interno di un’altra ipotesi nel suddetto elenco. Se i controlli hanno avuto esito positivo per tutte le ipotesi, rimarrà solo la seguente ipotesi: frammento 1 + frammento 2 + frammento 3. Pertanto, se l’opzione Allow embedded hypotheses non è selezionata, il programma formula ipotesi di lunghezza massima che soddisfano tutte le condizioni. Anche se le ipotesi incorporate sono escluse, le ipotesi possono intersecarsi. Questo può essere un singolo carattere o una parola isolata, oppure una stringa di caratteri che fa parte di altre ipotesi ma per la quale non sono state formulate ipotesi separate. Ad esempio, il programma può formulare due ipotesi (cioè due stringhe): una che termina con una certa parola o frase e un’altra che inizia con quella parola o frase. Es. ipotesi 1: frammento 1 + frammento 2 ipotesi 2: frammento 2 + frammento 3 Una volta generate tutte le possibili ipotesi, il programma calcola la qualità della condizione di ricerca per ciascuna (si tratta di una stima di quanto bene un’ipotesi soddisfi i vincoli di ricerca impostati nelle Search Conditions). In questa fase, la qualità viene calcolata in base al fatto che la lunghezza dell’ipotesi in caratteri rientri nell’intervallo fuzzy specificato nella proprietà Character count, che la lunghezza del gap totale nella riga rientri nell’intervallo fuzzy specificato in TotalGapLength e che il numero di parole nella riga rientri nell’intervallo fuzzy specificato in Word count. La qualità complessiva di un’ipotesi è calcolata moltiplicando tutte le qualità.

Advanced Designer