Pular para o conteúdo principal
O esquema descrito neste artigo define a estrutura dos arquivos JSON que contêm resultados de processamento de documentos para uma skill de OCR. Esses arquivos armazenam informações sobre elementos gráficos, elementos de texto, tabelas e listas detectados na imagem, bem como informações sobre a estrutura estimada do documento: todo o texto detectado é dividido em parágrafos, cada um dos quais recebe uma função específica. Os parágrafos são agrupados em seções lógicas. Todas as propriedades dos objetos, seus tipos de dados e seus valores permitidos estão listados no esquema JSON; portanto, recomendamos familiarizar-se com ele para facilitar a configuração de ferramentas para analisar arquivos JSON. Você pode baixar o esquema JSON para skills de OCR aqui. O objeto raiz descreve todo o documento reconhecido. Informações gerais sobre o documento são armazenadas nos objetos layout e content. O objeto layout descreve os parâmetros da imagem e todos os elementos gráficos e de texto detectados, enquanto o objeto content descreve os componentes de dados do documento e sua posição na estrutura lógica. A tabela abaixo lista todas as propriedades do objeto raiz:
PropriedadeTipo de dadoDescrição
version *stringA versão do documento de esquema JSON. Definido por padrão como: Vantage OCR.Skill JSON output v1.0
producer *stringA origem do arquivo JSON. Definido por padrão como: ABBYY Vantage OCR.Skill
languagesstring arrayUma lista de todos os idiomas detectados no documento.
layoutobjectEstrutura física (layout) do documento.
contentobjectConteúdo (estrutura lógica do documento).
  • Indica uma propriedade obrigatória.