Pular para o conteúdo principal
O esquema descrito neste artigo determina a estrutura dos arquivos JSON que contêm resultados de processamento de documentos para uma skill de OCR (Optical Character Recognition). Esses arquivos armazenam informações sobre elementos gráficos, elementos de texto, tabelas e listas detectados na imagem, bem como informações sobre a estrutura estimada do documento: todo o texto detectado é dividido em parágrafos, e a cada um deles é atribuída uma função específica. Os parágrafos são agrupados em seções lógicas. Todas as propriedades de objeto, seus tipos de dados e seus valores permitidos são listados no esquema JSON, por isso recomendamos que você se familiarize com ele para facilitar a configuração de ferramentas para análise de arquivos JSON. Você pode baixar o esquema JSON para skills de OCR aqui. O objeto raiz descreve todo o documento reconhecido. Informações gerais sobre o documento são armazenadas nos objetos layout e content. O objeto layout descreve os parâmetros da imagem e todos os elementos gráficos e de texto detectados, enquanto o objeto content descreve os componentes de dados do documento e seu lugar na estrutura lógica. A tabela abaixo lista todas as propriedades do objeto raiz:
PropriedadeTipo de dadoDescrição
version *stringVersão do documento de esquema JSON. Por padrão, definida como: Vantage OCR.Skill JSON output v1.0
producer *stringOrigem do arquivo JSON. Por padrão, definida como: ABBYY Vantage OCR.Skill
languagesstring arrayLista de todos os idiomas detectados no documento.
layoutobjectEstrutura física (layout) do documento.
contentobjectConteúdo (estrutura lógica do documento).
  • Indica uma propriedade obrigatória.