Vai al contenuto principale
ParameterDescrizione
String Value()Il valore del testo nell’immagine all’interno della regione dell’ipotesi.
Il programma considera tutti gli oggetti di testo che intersecano orizzontalmente l’area di ricerca (verticalmente gli oggetti devono rientrare interamente nell’area). Gli oggetti di testo vengono quindi raggruppati in righe, costruite da sinistra a destra. Il programma smette di costruire una riga quando la lunghezza massima dello spazio (impostata nella proprietà Max. space length) viene superata. Nelle righe risultanti, il programma identifica stringhe di caratteri, ciascuna contenente solo caratteri appartenenti a uno dei set di caratteri definiti dall’utente. In modo analogo, il programma suddivide le righe in frammenti. Successivamente, il programma formula un’ipotesi per ciascun frammento. A seconda che Allow embedded hypotheses sia selezionato o meno, le ipotesi vengono formulate secondo due principi diversi. Supponiamo che il programma abbia rilevato tre frammenti nella fase precedente. Se Allow embedded hypotheses è selezionato, le ipotesi vengono formulate come segue: ipotesi 1: frammento 1 ipotesi 2: frammento 1 + frammento 2 ipotesi 3: frammento 1 + frammento 2 + frammento 3 ipotesi 4: frammento 2 ipotesi 5: frammento 2 + frammento 3 ipotesi 6: frammento 3 Per ciascuna ipotesi, il programma verifica che la quota di caratteri di ciascun set non superi il valore impostato nel field Portion in text, %. Analogamente, verifica che la percentuale di caratteri non alfabetici non superi il valore impostato nel field Allowed errors. Se almeno uno dei controlli non viene superato, l’ipotesi non viene formulata. Se Allow embedded hypotheses non è selezionato, le ipotesi annidate nell’elenco sopra vengono scartate. Le ipotesi annidate sono quelle contenute all’interno di un’altra ipotesi nell’elenco. Se i controlli hanno avuto esito positivo per tutte le ipotesi, rimarrà solo la seguente: frammento 1 + frammento 2 + frammento 3. Pertanto, se Allow embedded hypotheses non è selezionato, il programma formula ipotesi di lunghezza massima che soddisfano tutte le condizioni. Anche se le ipotesi annidate sono escluse, le ipotesi possono intersecarsi. Questo può essere un singolo carattere o una singola parola, oppure una stringa di caratteri che fa parte di altre ipotesi ma per la quale non sono state formulate ipotesi separate. Ad esempio, il programma può formulare due ipotesi (cioè due stringhe): una che termina con una certa parola o frase e un’altra che inizia con la stessa parola o frase. Ad es. ipotesi 1: frammento 1 + frammento 2 ipotesi 2: frammento 2 + frammento 3 Una volta generate tutte le possibili ipotesi, il programma calcola la qualità della condizione di ricerca per ciascuna (si tratta di una stima di quanto bene un’ipotesi soddisfi i vincoli di ricerca impostati nelle Search Conditions). In questa fase, la qualità viene calcolata in base al fatto che la lunghezza dell’ipotesi in caratteri rientri nell’intervallo fuzzy specificato nella proprietà Character count, che la lunghezza totale degli spazi nella riga rientri nell’intervallo fuzzy specificato in TotalGapLength e che il numero di parole nella riga rientri nell’intervallo fuzzy specificato in Word count. La qualità complessiva di un’ipotesi viene calcolata moltiplicando tutte le qualità.