Saltar al contenido principal
Un intervalo difuso es una herramienta que permite al programa evaluar la calidad de una hipótesis en función de su longitud. Un intervalo difuso puede medirse en unidades de longitud (dots, milímetros, etc.) o en caracteres (en el caso de las líneas). Para un intervalo difuso, se deben especificar cuatro valores que definen los rangos óptimo y posible de valores. Suponga que tiene un intervalo difuso [f1,f2,f3,f4] y la longitud de la cadena de caracteres detectada (o la longitud del espacio detectado) es L. Si la longitud L está en el rango de f2 a f3 (es decir, L>=f2 y L<=f3), la calidad de la hipótesis es 1. Si la longitud está en el rango de f1 a f2, la calidad de la hipótesis cambia en proporción directa de 0 a 1 (Quality(f1) = 0, Quality(f2) = 1). De manera similar, si la longitud está en el rango de f3 a f4, la calidad de la hipótesis cambia en proporción directa de 1 a 0 (Quality(f3) = 1, Quality(f4) = 0). Si la longitud no está dentro del rango de f1 a f4 (es decir, Lf4), la calidad de la hipótesis es 0 (Quality(L) = 0). La calidad de la hipótesis para el objeto detectado se multiplica por el valor de la propiedad recuento de caracteres. El valor de esta propiedad se selecciona según la longitud del objeto detectado.
La calidad de cualquier cadena de hipótesis para varios elementos se calcula multiplicando las hipótesis de cada elemento. Si la cadena es relativamente larga y las estimaciones de calidad de las hipótesis que la componen son demasiado bajas como resultado de restricciones excesivamente estrictas, la calidad resultante de toda la cadena puede ser demasiado baja.
Asegúrese de que la hipótesis seleccionada tenga la mayor estimación de calidad posible. Por otro lado, debe poder distinguir las hipótesis por su calidad para poder seleccionar la mejor. Por lo tanto, debe configurar los intervalos difusos de modo que las hipótesis aceptables no se penalicen en exceso. También puede usar valores negativos para el límite izquierdo del intervalo difuso (aunque en realidad no existen cadenas de longitud negativa). Esto puede ser útil, ya que hará que la dependencia de la calidad en el rango de 0 a 1 sea menos pronunciada, reduciendo así la penalización. Si al mismo tiempo necesita establecer el límite inferior para este parámetro (por ejemplo, la longitud de la cadena no puede ser inferior a 10 caracteres y el intervalo difuso para la longitud de la cadena es [-10,20,30,40]), puede hacerlo directamente en la pestaña Advanced escribiendo Value.Length >= 10 en el panel Relaciones avanzadas de posbúsqueda. En general, es aconsejable no establecer intervalos demasiado rígidos. Esto es especialmente importante al procesar imágenes de calidad variable. En algunas imágenes, por ejemplo, puede haber espacios dentro de las letras debido a la mala calidad del documento de origen o a una configuración de escaneo deficiente. En este caso, el programa puede interpretar un carácter como varios caracteres, lo que puede provocar una reducción drástica de la calidad de la hipótesis si el intervalo difuso era demasiado rígido. Como resultado, el programa descartará una hipótesis que en esencia es correcta y seleccionará otra hipótesis. Por este motivo, si necesita seleccionar entre hipótesis de cadena de caracteres comparando sus longitudes, lo mejor es especificar restricciones adicionales en el panel Relaciones avanzadas de posbúsqueda.”

Editor visual de intervalo difuso

ABBYY FlexiLayout Studio ofrece un editor visual para facilitar la definición de intervalos difusos. Puede abrir el editor de intervalo difuso desde el cuadro de diálogo de propiedades de un elemento cadena de caracteres (pestaña cadena de caracteres, botones ) o desde el menú principal seleccionando Herramientas → Editor de intervalo difuso…