Esquema JSON de la skill OCR - ABBYY Documentation

El esquema descrito en este artículo determina la estructura de los archivos JSON que contienen resultados de procesamiento de documentos para una skill de Reconocimiento óptico de caracteres (OCR). Estos archivos almacenan información sobre elementos gráficos, elementos de texto, tablas y listas detectadas en la imagen, así como información sobre la estructura estimada del documento: todo el texto detectado se divide en párrafos, a cada uno de los cuales se le asigna una función específica. Los párrafos se agrupan en secciones lógicas. Todas las propiedades de los objetos, sus tipos de datos y sus valores permitidos se enumeran en el esquema JSON; por lo tanto, recomendamos familiarizarse con él para facilitar la configuración de las herramientas de análisis de archivos JSON. Puede descargar aquí el esquema JSON para skills de OCR. El objeto raíz describe todo el documento reconocido. La información general sobre el documento se almacena en los objetos layout y content. El objeto layout describe los parámetros de la imagen y todos los elementos gráficos y de texto detectados, mientras que el objeto content describe los componentes de datos del documento y su lugar en la estructura lógica del mismo. La siguiente tabla enumera todas las propiedades del objeto raíz:

Property	Data type	Description
`version` *	`string`	Versión del documento de esquema JSON. De forma predeterminada se establece en lo siguiente: Vantage OCR.Skill JSON output v1.0
`producer` *	`string`	Origen del archivo JSON. De forma predeterminada se establece en lo siguiente: ABBYY Vantage OCR.Skill
`languages`	`string array`	Lista de todos los idiomas detectados en el documento.
layout	`object`	Estructura física (layout) del documento.
content	`object`	Contenido (estructura lógica del documento).

Indica una propiedad obligatoria.