Esquema JSON da Skill de OCR

O esquema descrito neste artigo determina a estrutura dos arquivos JSON que contêm resultados de processamento de documentos para uma skill de OCR (Optical Character Recognition). Esses arquivos armazenam informações sobre elementos gráficos, elementos de texto, tabelas e listas detectados na imagem, bem como informações sobre a estrutura estimada do documento: todo o texto detectado é dividido em parágrafos, e a cada um deles é atribuída uma função específica. Os parágrafos são agrupados em seções lógicas. Todas as propriedades de objeto, seus tipos de dados e seus valores permitidos são listados no esquema JSON, por isso recomendamos que você se familiarize com ele para facilitar a configuração de ferramentas para análise de arquivos JSON. Você pode baixar o esquema JSON para skills de OCR aqui. O objeto raiz descreve todo o documento reconhecido. Informações gerais sobre o documento são armazenadas nos objetos layout e content. O objeto layout descreve os parâmetros da imagem e todos os elementos gráficos e de texto detectados, enquanto o objeto content descreve os componentes de dados do documento e seu lugar na estrutura lógica. A tabela abaixo lista todas as propriedades do objeto raiz:

Propriedade	Tipo de dado	Descrição
`version` *	`string`	Versão do documento de esquema JSON. Por padrão, definida como: Vantage OCR.Skill JSON output v1.0
`producer` *	`string`	Origem do arquivo JSON. Por padrão, definida como: ABBYY Vantage OCR.Skill
`languages`	`string array`	Lista de todos os idiomas detectados no documento.
layout	`object`	Estrutura física (layout) do documento.
content	`object`	Conteúdo (estrutura lógica do documento).

Indica uma propriedade obrigatória.

Guia do desenvolvedor

Visão geral

API REST de processamento do Vantage

API de relatórios do Vantage