Saltar al contenido principal
Cada elemento del arreglo pages describe una sola página del documento y, a su vez, contiene sus propios arreglos que representan textos, tablas, imágenes, códigos de barras, casillas de verificación y separadores detectados en esa página. Las propiedades de cada elemento se utilizan para almacenar las coordenadas de la región correspondiente en la imagen. El nivel de confianza en que el elemento haya sido reconocido correctamente también se almacena en las propiedades de los elementos de texto.
Nota: Si el documento se exporta a JSON pero no a ninguno de los formatos de imagen, las coordenadas se especificarán con respecto a la imagen original. Si el documento se exporta a JSON y, al mismo tiempo, a uno de los formatos de imagen, las coordenadas se especificarán con respecto a la imagen preprocesada que se exporta.
Todos los elementos de texto se ubican en el arreglo texts o en el arreglo tables.
PropiedadTipo de datoDescripción
widthintegerEl ancho de la página en píxeles.
heightintegerLa altura de la página en píxeles.
rotatedstring enumRotación de la página con respecto a la imagen original. Valores posibles: none, clockwise, counterclockwise, upside-down
textsobject arrayArreglo de bloques de texto.
tablesobject arrayArreglo de bloques que contienen tablas.
picturespicture object arrayArreglo de bloques de imagen.
barcodesbarcode object arrayArreglo de bloques de códigos de barras.
separatorsobject arrayArreglo de bloques separadores.
checkmarksobject arrayArreglo de bloques de casillas de verificación.

Confianza

Todos los objetos que describen texto o imágenes reconocidos tienen una propiedad llamada confianza, que indica la probabilidad de que el texto se haya reconocido correctamente. Primero, se calcula un nivel de confianza para caracteres individuales. El nivel de confianza de los elementos de niveles superiores se calcula a partir de los niveles de confianza de los elementos que contienen. Para esta propiedad se define un tipo de datos especial denominado confianza. Este tipo de datos es un derivado del tipo de datos numérico. Los valores permitidos van de 0 a 100. Un valor de -1 indica un elemento que no contiene datos de texto.