Hipótesis de cadena de caracteres

Parameter	Description
`String Value()`	El valor del texto en la imagen dentro de la región de la hipótesis.

El programa considera todos los objetos de texto que intersectan horizontalmente el área de búsqueda (verticalmente, los objetos deben quedar completamente dentro del área de búsqueda). A continuación, los objetos de texto se agrupan en líneas. Las líneas se construyen de izquierda a derecha. El programa deja de construir una línea cuando se supera la longitud máxima de espacio (establecida en la propiedad Max. space length). En las líneas resultantes, el programa identifica cadenas de caracteres, cada una de las cuales contiene caracteres únicamente de uno de los conjuntos de caracteres definidos por el usuario. Del mismo modo, el programa divide las líneas en fragmentos. A continuación, el programa formula una hipótesis para cada uno de los fragmentos. Según si Allow embedded hypotheses está seleccionado o no, las hipótesis se formulan con dos principios diferentes. Supongamos que el programa detectó tres fragmentos en una etapa anterior. Si Allow embedded hypotheses está seleccionado, las hipótesis se formulan de la siguiente manera: hipótesis 1: fragmento 1 hipótesis 2: fragmento 1 + fragmento 2 hipótesis 3: fragmento 1 + fragmento 2 + fragmento 3 hipótesis 4: fragmento 2 hipótesis 5: fragmento 2 + fragmento 3 hipótesis 6: fragmento 3 Para cada hipótesis, el programa comprobará que la proporción de caracteres de cada conjunto de caracteres no exceda el valor establecido en el campo Portion in text, %. Del mismo modo, el programa comprueba que el porcentaje de caracteres no alfabéticos no exceda el valor establecido en el campo Allowed errors. Si al menos una de las comprobaciones falla, no se formula ninguna hipótesis. Si Allow embedded hypotheses no está seleccionado, se descartarán las hipótesis incrustadas de la lista anterior. Se consideran hipótesis incrustadas aquellas que están contenidas dentro de otra hipótesis de la lista anterior. Si las comprobaciones fueron satisfactorias para todas las hipótesis, solo permanecerá la siguiente hipótesis: fragmento 1 + fragmento 2 + fragmento 3. Así, si Allow embedded hypotheses no está seleccionado, el programa formula hipótesis de longitud máxima que cumplan todas las condiciones. Aunque se excluyen las hipótesis incrustadas, las hipótesis pueden intersectarse. Esto puede ser un carácter o palabra independiente, o una cadena de caracteres que forme parte de otras hipótesis pero para la cual no se han formulado hipótesis por separado. Por ejemplo, el programa puede formular dos hipótesis (es decir, dos cadenas): una que termina en cierta palabra o frase y otra que comienza con esa palabra o frase. P. ej.: hipótesis 1: fragmento 1 + fragmento 2 hipótesis 2: fragmento 2 + fragmento 3 Una vez generadas todas las hipótesis posibles, el programa calcula la calidad de la condición de búsqueda para cada una (es una estimación de qué tan bien una hipótesis cumple las restricciones de búsqueda establecidas en Search Conditions). En esta etapa, la calidad se calcula en función de si la longitud de la hipótesis en caracteres cae dentro del intervalo difuso especificado en la propiedad Character count, de si la longitud de la separación total en la línea cae dentro del intervalo difuso especificado en TotalGapLength, y de si el número de palabras en la línea cae dentro del intervalo difuso especificado en Word count. La calidad global de una hipótesis se calcula multiplicando todas las calidades.

Hipótesis de colección de objetos

Hipótesis de Texto estático

⌘I