Schéma JSON de la Skill OCR - ABBYY Documentation

Le schéma décrit dans cet article détermine la structure des fichiers JSON contenant les résultats de traitement de documents pour une Skill OCR. Ces fichiers stockent des informations sur les éléments graphiques, les éléments textuels, les tableaux et les listes détectés sur l’image, ainsi que des informations sur la structure estimée du document : tout le texte détecté est divisé en paragraphes, auxquels une fonction spécifique est attribuée. Les paragraphes sont regroupés en sections logiques. Toutes les propriétés des objets, leurs types de données et leurs valeurs autorisées sont répertoriés dans le schéma JSON, c’est pourquoi nous vous recommandons de vous y familiariser afin de faciliter la configuration des outils d’analyse des fichiers JSON. Vous pouvez télécharger le schéma JSON pour les Skills OCR ici. L’objet racine décrit l’ensemble du document reconnu. Les informations générales sur le document sont stockées dans les objets layout et content. L’objet layout décrit les paramètres de l’image et tous les éléments graphiques et textuels détectés, tandis que l’objet content décrit les composants de données du document et leur place dans sa structure logique. Le tableau ci-dessous répertorie toutes les propriétés de l’objet racine :

Property	Data type	Description
`version` *	`string`	La version du document de schéma JSON. Par défaut, la valeur suivante est utilisée : Vantage OCR.Skill JSON output v1.0
`producer` *	`string`	La source du fichier JSON. Par défaut, la valeur suivante est utilisée : ABBYY Vantage OCR.Skill
`languages`	`string array`	Une liste de toutes les langues détectées dans le document.
layout	`object`	Structure physique (de mise en page) du document.
content	`object`	Contenu (structure logique du document).

Indique une propriété obligatoire.