Saltar al contenido principal
Este objeto representa el texto reconocido en un formato especial de “texto sin formato”. Proporciona información únicamente sobre los caracteres de texto reconocidos, su nivel de confianza y sus posiciones relativas en la imagen de origen. Puede obtener esta información tanto de un solo carácter como de todos los caracteres del texto.
En caso de reconocimiento de código de barras, la propiedad Text del objeto PlainText está vacía. Si necesita obtener el texto reconocido de un documento de una sola página que contiene un único código de barras, use la propiedad Text del primer bloque del Layout:
document.Pages[0].Layout.Blocks[0].GetAsBarcodeBlock().Text

Propiedades

,de solo lectura

Devuelve el objeto Engine.

, de solo lectura

Proporciona acceso al texto reconocido completo en forma de cadena Unicode. Esta cadena puede contener los siguientes caracteres especiales:

  • 0x2028 — Símbolo de salto de línea
  • 0x2029 — Símbolo de salto de párrafo
  • 0xFFFC — Carácter de reemplazo de objeto (indica una imagen incrustada dentro del texto)
  • 0x0009 — Tabulación
  • 0x005E — Acento circunflejo (^), utilizado por ABBYY FineReader Engine como sustituto de caracteres no reconocidos
  • 0x00AC — Guion suave
Si la imagen contiene tablas, el texto de las celdas se almacenará en el orden de lectura lógico (de izquierda a derecha y de arriba hacia abajo).

, de solo lectura

Devuelve el número de símbolos del texto, incluidos los caracteres especiales.

, de solo lectura

Esta propiedad recibe como parámetro de entrada el índice de un símbolo en el texto reconocido. Devuelve el número de la página en la que se encuentra el símbolo especificado.

, de solo lectura

Devuelve el valor de confianza de reconocimiento del carácter. Este corresponde al nivel de confianza de la variante de reconocimiento principal (seleccionada).

La confianza estima la precisión de una variante de reconocimiento. No debe interpretarse como una medida general de calidad del reconocimiento: el único uso válido de la confianza es comparar variantes de reconocimiento del mismo carácter. Los caracteres extraídos del archivo PDF de origen sin reconocimiento tienen la confianza establecida en 55.

, de solo lectura

Devuelve la probabilidad estimada (en un rango de 0 a 100) de que el carácter especificado haya sido reconocido incorrectamente.

, de solo lectura

Devuelve TRUE si el carácter especificado fue reconocido de forma poco fiable. Utilice esta propiedad para determinar si se requiere verificación.

Esta propiedad se calcula en función del valor de ErrorProbability y la configuración de reconocimiento. Si necesita implementar distinciones más detalladas para la verificación, utilice ErrorProbability en su lugar.

, de solo lectura

Esta propiedad recibe como parámetro de entrada el índice de un símbolo en el texto reconocido. Devuelve la coordenada del borde inferior del rectángulo del símbolo en relación con la imagenblack-and-whiteplano de la imagen de origen.

, de solo lectura

Esta propiedad recibe como parámetro de entrada el índice de un símbolo en el texto reconocido. Devuelve la coordenada del borde izquierdo del rectángulo del carácter con respecto al planoen blanco y negrosin inclinación de la imagen de origen.

, de solo lectura

Esta propiedad recibe como parámetro de entrada el índice de un símbolo en el texto reconocido. Devuelve la coordenada del borde derecho del rectángulo del símbolo con respecto al planoen blanco y negrosin inclinación de la imagen de origen.

, de solo lectura

Esta propiedad recibe como parámetro de entrada el índice de un símbolo en el texto reconocido. Devuelve la coordenada del borde superior del rectángulo del símbolo con respecto al planoen blanco y negrosin inclinación de la imagen de origen.

Métodos

NombreDescripción
GetCharacterData <Note> Solo para Windows. </Note>Devuelve información sobre todos los caracteres del texto como un conjunto de matrices: los números de las páginas en las que se encuentran los caracteres, las coordenadas de los rectángulos de los caracteres y sus niveles de confianza.
SaveToAsciiXMLFileGuarda el texto reconocido en un archivo XML.
SaveToTextFileGuarda el texto reconocido en un archivo de texto con la codificación especificada.
PlainText Diagrama de objetos

Consulte también

¿Cuál es la diferencia entre CharConfidence, ErrorProbability e IsSuspicious? Trabajar con texto Trabajar con propiedades