Saltar al contenido principal
El esquema descrito en este artículo determina la estructura de los archivos JSON que contienen resultados de procesamiento de documentos para una skill de Reconocimiento óptico de caracteres (OCR). Estos archivos almacenan información sobre elementos gráficos, elementos de texto, tablas y listas detectadas en la imagen, así como información sobre la estructura estimada del documento: todo el texto detectado se divide en párrafos, a cada uno de los cuales se le asigna una función específica. Los párrafos se agrupan en secciones lógicas. Todas las propiedades de los objetos, sus tipos de datos y sus valores permitidos se enumeran en el esquema JSON; por lo tanto, recomendamos familiarizarse con él para facilitar la configuración de las herramientas de análisis de archivos JSON. Puede descargar aquí el esquema JSON para skills de OCR. El objeto raíz describe todo el documento reconocido. La información general sobre el documento se almacena en los objetos layout y content. El objeto layout describe los parámetros de la imagen y todos los elementos gráficos y de texto detectados, mientras que el objeto content describe los componentes de datos del documento y su lugar en la estructura lógica del mismo. La siguiente tabla enumera todas las propiedades del objeto raíz:
PropertyData typeDescription
version *stringVersión del documento de esquema JSON. De forma predeterminada se establece en lo siguiente: Vantage OCR.Skill JSON output v1.0
producer *stringOrigen del archivo JSON. De forma predeterminada se establece en lo siguiente: ABBYY Vantage OCR.Skill
languagesstring arrayLista de todos los idiomas detectados en el documento.
layoutobjectEstructura física (layout) del documento.
contentobjectContenido (estructura lógica del documento).
  • Indica una propiedad obligatoria.