Vai al contenuto principale
Un intervallo fuzzy è uno strumento che consente al programma di valutare la qualità di un’ipotesi in base alla sua lunghezza. Un intervallo fuzzy può essere misurato in unità di lunghezza (punti, millimetri, ecc.) o in caratteri (nel caso delle righe). Per un intervallo fuzzy è necessario specificare quattro valori che determinano l’intervallo di valori possibili e ottimali. Per semplificare, il programma include un editor di intervalli fuzzy facile da usare. Supponiamo di avere un intervallo fuzzy {f1,f2,f3,f4} e che la lunghezza della stringa rilevata (in caratteri, o in punti per uno spazio rilevato) sia L. Se la lunghezza L è nell’intervallo da f2 a f3 (cioè L>=f2 and L<=f3), la qualità dell’ipotesi è 1. Se la lunghezza è nell’intervallo da f1 a f2, la qualità dell’ipotesi varia in proporzione diretta da 0 a 1 (Quality(f1) = 0, Quality(f2)=1). Analogamente, se la lunghezza è nell’intervallo da f3 a f4, la qualità dell’ipotesi varia in proporzione diretta da 1 a 0 (Quality(f3) = 1, Quality(f4) = 0). Se la lunghezza non rientra nell’intervallo da f1 a f4 (cioè L<f1 or L>f4), la qualità dell’ipotesi è 0 (Quality(L) = 0). La qualità dell’ipotesi per l’oggetto rilevato viene moltiplicata per i valori della proprietà Character count, che viene selezionata in base alla lunghezza dell’oggetto rilevato. Fuzzy_interval Nota: La qualità di qualsiasi catena di ipotesi per più elementi viene calcolata moltiplicando le qualità delle ipotesi per ciascun elemento della catena. Se la catena è sufficientemente lunga e le stime di qualità delle ipotesi che la compongono sono troppo basse a causa di vincoli eccessivamente rigidi, la qualità risultante dell’intera catena potrebbe essere anch’essa troppo bassa. Pertanto, si consiglia di assicurarsi che l’ipotesi selezionata abbia la stima di qualità più alta possibile. D’altra parte, è necessario poter distinguere le ipotesi in base alla loro qualità, così da selezionare la migliore. Pertanto, è necessario configurare gli intervalli fuzzy (funzioni matematiche per la valutazione delle ipotesi) in modo che le ipotesi accettabili non vengano penalizzate eccessivamente. Possono essere utilizzati anche valori negativi per il limite sinistro dell’intervallo fuzzy (anche se in realtà non esistono stringhe di lunghezza negativa). Questo può essere utile per rendere meno ripida la curva della qualità nell’intervallo (0, 1), riducendo così la penalizzazione sulla qualità. Se è necessario impostare un limite inferiore per questo parametro (ad es. la lunghezza della stringa non può essere inferiore a 10 caratteri con l’intervallo fuzzy per la lunghezza della stringa [-10,20,30,40}), è possibile farlo direttamente in Hypothesis Evaluation impostando Value.Length >= 10. Fuzzy_interval_I Non consigliamo di rendere i limiti dell’intervallo troppo rigidi. Questo è particolarmente importante quando si elaborano immagini di qualità variabile. In alcune immagini, ad esempio, potrebbero esserci spazi tra le lettere a causa della bassa qualità del documento originale o di particolari impostazioni di scansione. In tal caso, il programma potrebbe interpretare un carattere come più caratteri, con una drastica riduzione della qualità dell’ipotesi se l’intervallo è eccessivamente rigido. Di conseguenza, il programma potrebbe scartare tale ipotesi (che in sostanza avrebbe potuto essere corretta) e selezionarne un’altra. Per questo motivo, se è necessario scegliere tra ipotesi confrontandone le lunghezze, è opportuno farlo utilizzando condizioni aggiuntive in Hypothesis Evaluation.