Vai al contenuto principale
Un intervallo fuzzy è uno strumento che consente al programma di valutare la qualità di un’ipotesi in base alla sua lunghezza. Un intervallo fuzzy può essere misurato in unità di lunghezza (punti, millimetri, ecc.) oppure in caratteri (nel caso delle righe). Per un intervallo fuzzy devono essere specificati quattro valori che determinano l’intervallo di valori possibile e ottimale. Per semplificare, il programma include un editor di intervalli fuzzy facile da usare. Supponiamo di avere un intervallo fuzzy {f1,f2,f3,f4} e che la lunghezza della stringa rilevata (in caratteri, o in punti per uno spazio rilevato) sia L. Se la lunghezza L è compresa tra f2 e f3 (cioè L>=f2 and L<=f3), la qualità dell’ipotesi è 1. Se la lunghezza è compresa tra f1 e f2, la qualità dell’ipotesi varia in proporzione diretta da 0 a 1 (Quality(f1) = 0, Quality(f2)=1). Analogamente, se la lunghezza è compresa tra f3 e f4, la qualità dell’ipotesi varia in proporzione diretta da 1 a 0 (Quality(f3) = 1, Quality(f4) = 0). Se la lunghezza non rientra nell’intervallo da f1 a f4 (cioè L<f1 or L>f4), la qualità dell’ipotesi è 0 (Quality(L) = 0). La qualità dell’ipotesi per l’oggetto rilevato viene moltiplicata per i valori della proprietà Character count, selezionata in base alla lunghezza dell’oggetto rilevato. Fuzzy_interval
Nota: La qualità di qualsiasi catena di ipotesi per più elementi viene calcolata moltiplicando le qualità delle ipotesi per ciascun elemento della catena. Se la catena è sufficientemente lunga e le stime di qualità delle ipotesi costituenti sono troppo basse a causa di restrizioni eccessivamente rigide, la qualità risultante dell’intera catena potrebbe essere anch’essa troppo bassa.
Pertanto, si consiglia di assicurarsi che l’ipotesi selezionata abbia la stima di qualità più alta possibile. D’altra parte, è necessario poter distinguere le ipotesi in base alla loro qualità, così da selezionare la migliore. Di conseguenza, è necessario configurare gli intervalli fuzzy (funzioni matematiche per la valutazione delle ipotesi) in modo che le ipotesi accettabili non vengano penalizzate eccessivamente. Possono essere utilizzati anche valori negativi per il limite sinistro dell’intervallo fuzzy (sebbene in realtà non esistano stringhe di lunghezza negativa). Ciò può essere utile per rendere il grafico della qualità meno ripido nell’intervallo (0, 1), riducendo così la penalità sulla qualità. Se è necessario impostare un limite inferiore per questo parametro (ad es. la lunghezza della stringa non può essere inferiore a 10 caratteri con l’intervallo fuzzy per la lunghezza della stringa [-10,20,30,40}), è possibile farlo direttamente in Hypothesis Evaluation impostando Value.Length >=10. Fuzzy_interval_I Sconsigliamo di rendere i limiti dell’intervallo troppo rigidi. Ciò è particolarmente importante quando si elaborano immagini di qualità variabile. In alcune immagini, ad esempio, potrebbero esserci spazi tra le lettere a causa della scarsa qualità del documento di origine o di specifiche opzioni di scansione. In questo caso, il programma può interpretare un carattere come più caratteri, il che può comportare una drastica diminuzione della qualità dell’ipotesi se l’intervallo è eccessivamente rigido. Di conseguenza, il programma potrebbe scartare tale ipotesi (che in sostanza potrebbe essere corretta) e selezionarne un’altra. Per questo motivo, se è necessario selezionare tra ipotesi confrontandone le lunghezze, ciò andrebbe fatto utilizzando condizioni aggiuntive in Hypothesis Evaluation.