Saltar al contenido principal
ParameterDescription
String Value()El valor del texto en la imagen dentro de la región de la hipótesis.
El programa considera todos los objetos de texto que intersectan horizontalmente el área de búsqueda (en el eje vertical, los objetos deben caber por completo dentro del área de búsqueda). Luego, los objetos de texto se agrupan en líneas. Las líneas se construyen de izquierda a derecha. El programa deja de construir una línea cuando se excede la longitud máxima de espacio (establecida en la propiedad Max. space length). En las líneas resultantes, el programa identifica cadenas de caracteres, cada una de las cuales contiene caracteres únicamente de uno de los conjuntos de caracteres definidos por el usuario. De manera similar, el programa divide las líneas en fragmentos. A continuación, el programa formula una hipótesis para cada uno de los fragmentos. Dependiendo de si Allow embedded hypotheses está seleccionada o no, las hipótesis se formulan conforme a dos principios diferentes. Supongamos que el programa detectó tres fragmentos en una etapa anterior. Si Allow embedded hypotheses está seleccionada, las hipótesis se formulan de la siguiente manera: hipótesis 1: fragmento 1 hipótesis 2: fragmento 1 + fragmento 2 hipótesis 3: fragmento 1 + fragmento 2 + fragmento 3 hipótesis 4: fragmento 2 hipótesis 5: fragmento 2 + fragmento 3 hipótesis 6: fragmento 3 Para cada hipótesis, el programa verificará que la proporción de caracteres de cada conjunto de caracteres no exceda el valor establecido en el campo Portion in text, %. Del mismo modo, el programa verifica que el porcentaje de caracteres no alfabéticos no exceda el valor establecido en el campo Allowed errors. Si al menos una de las comprobaciones falla, no se formulará ninguna hipótesis. Si Allow embedded hypotheses no está seleccionada, se descartarán las hipótesis incrustadas de la lista anterior. Las hipótesis incrustadas son aquellas que están contenidas dentro de otra hipótesis de la lista anterior. Si las comprobaciones fueron satisfactorias para todas las hipótesis, solo permanecerá la siguiente hipótesis: fragmento 1 + fragmento 2 + fragmento 3. Así, si Allow embedded hypotheses no está seleccionada, el programa formula hipótesis de longitud máxima que cumplen todas las condiciones. Aunque se excluyen las hipótesis incrustadas, las hipótesis pueden intersectarse. Esto puede ser un carácter o una palabra independiente, o una cadena de caracteres que forma parte de otras hipótesis pero para la cual no se han formulado hipótesis por separado. Por ejemplo, el programa puede formular dos hipótesis (es decir, dos cadenas): una que termina en cierta palabra o frase y otra que comienza con esa misma palabra o frase. P. ej. hipótesis 1: fragmento 1 + fragmento 2 hipótesis 2: fragmento 2 + fragmento 3 Una vez generadas todas las hipótesis posibles, el programa calcula la calidad de la condición de búsqueda para cada una (es una estimación de qué tan bien una hipótesis cumple con las restricciones de búsqueda establecidas en Search Conditions). En esta etapa, la calidad se calcula en función de si la longitud de la hipótesis en caracteres cae dentro del intervalo difuso especificado en la propiedad Character count, de si la longitud del espacio total en la línea cae dentro del intervalo difuso especificado en TotalGapLength, y de si el número de palabras en la línea cae dentro del intervalo difuso especificado en Word count. La calidad general de una hipótesis se calcula multiplicando todas las calidades.