Saltar al contenido principal
Un intervalo difuso es una herramienta que permite al programa evaluar la calidad de una hipótesis en función de su longitud. Un intervalo difuso puede medirse en unidades de longitud (puntos, milímetros, etc.) o en caracteres (en el caso de las líneas). En un intervalo difuso deben especificarse cuatro valores que determinan el rango posible y el rango óptimo. Para simplificar, el programa incluye un editor de intervalos difusos fácil de usar. Supongamos que tiene un intervalo difuso {f1,f2,f3,f4} y que la longitud de la cadena detectada (en caracteres, o en puntos para un espacio detectado) es L. Si la longitud L está en el rango de f2 a f3 (es decir, L>=f2 and L<=f3), la calidad de la hipótesis es 1. Si la longitud está en el rango de f1 a f2, la calidad de la hipótesis varía en proporción directa de 0 a 1 (Quality(f1) = 0, Quality(f2)=1). De manera similar, si la longitud está en el rango de f3 a f4, la calidad de la hipótesis varía en proporción directa de 1 a 0 (Quality(f3) = 1, Quality(f4) = 0). Si la longitud no entra en el rango de f1 a f4 (es decir, L<f1 or L>f4), la calidad de la hipótesis es 0 (Quality(L) = 0). La calidad de la hipótesis para el objeto detectado se multiplica por los valores de la propiedad Character count, que se selecciona según la longitud del objeto detectado. Fuzzy_interval
Nota: La calidad de cualquier cadena de hipótesis para varios elementos se calcula multiplicando las hipótesis de cada elemento de la cadena. Si la cadena es lo suficientemente larga y las estimaciones de calidad de las hipótesis que la componen son demasiado bajas debido a restricciones excesivamente estrictas, la calidad resultante de toda la cadena también puede ser demasiado baja.
Por lo tanto, se recomienda asegurarse de que la hipótesis seleccionada tenga la mayor estimación de calidad posible. Por otro lado, es necesario poder distinguir las hipótesis por su calidad para poder seleccionar la mejor. Por lo tanto, debe configurar los intervalos difusos (que son funciones matemáticas para la evaluación de hipótesis) de manera que las hipótesis aceptables no se penalicen en exceso. También se pueden usar valores negativos para el límite izquierdo del intervalo difuso (aunque en realidad no existen cadenas de longitud negativa). Esto puede ser útil para que la gráfica de calidad sea menos pronunciada en el intervalo (0, 1), reduciendo así la penalización de calidad. Si necesita establecer un límite inferior para este parámetro (por ejemplo, la longitud de la cadena no puede ser menor que 10 caracteres, con el intervalo difuso para la longitud de la cadena siendo [-10,20,30,40}), puede hacerlo directamente en Hypothesis Evaluation estableciendo Value.Length >=10. Fuzzy_interval_I No recomendamos establecer límites de intervalo demasiado estrictos. Esto es especialmente importante al procesar imágenes de calidad variable. En algunas imágenes, por ejemplo, puede haber espacios entre letras debido a la baja calidad del documento de origen o a determinadas opciones de escaneo. En este caso, el programa puede interpretar un carácter como varios, lo que puede provocar una disminución drástica de la calidad de la hipótesis si el intervalo era demasiado estricto. Como resultado, el programa puede descartar esa hipótesis (que en esencia podría haber sido correcta) y seleccionar otra. Por esta razón, si necesita elegir entre hipótesis comparando sus longitudes, esto debe hacerse utilizando condiciones adicionales en Hypothesis Evaluation.