Saltar al contenido principal
El esquema descrito en este artículo determina la estructura de los archivos JSON que contienen resultados de procesamiento de documentos para una Habilidad de OCR. Estos archivos almacenan información sobre elementos gráficos, elementos de texto, tablas y listas detectados en la imagen, así como información sobre la estructura estimada del documento: todo el texto detectado se divide en párrafos, a cada uno de los cuales se le asigna una función específica. Los párrafos se agrupan en secciones lógicas. Todas las propiedades de los objetos, sus tipos de datos y sus valores permitidos se enumeran en el esquema JSON; por lo tanto, recomendamos familiarizarse con él para facilitar la configuración de herramientas para analizar archivos JSON. Puede descargar aquí el esquema JSON para Habilidades de OCR. El objeto raíz describe todo el documento reconocido. La información general sobre el documento se almacena en los objetos layout y content. El objeto layout describe los parámetros de la imagen y todos los elementos gráficos y de texto detectados, mientras que el objeto content describe los componentes de datos del documento y su lugar en su estructura lógica. La siguiente tabla enumera todas las propiedades del objeto raíz:
PropertyData typeDescription
version *stringLa versión del documento de esquema JSON. Valor predeterminado: Vantage OCR.Skill JSON output v1.0
producer *stringEl origen del archivo JSON. Valor predeterminado: ABBYY Vantage OCR.Skill
languagesstring arrayLista de todos los idiomas detectados en el documento.
layoutobjectEstructura física (de diseño) del documento.
contentobjectContenido (estructura lógica del documento).
  • Indica una propiedad obligatoria.