Passer au contenu principal
Le schéma décrit dans cet article définit la structure des fichiers JSON contenant les résultats du traitement de documents pour une Skill OCR. Ces fichiers stockent des informations sur les éléments graphiques, les éléments textuels, les tableaux et les listes détectés sur l’image, ainsi que des informations sur la structure estimée du document : tout le texte détecté est découpé en paragraphes, auxquels une fonction spécifique est attribuée. Les paragraphes sont regroupés en sections logiques. Toutes les propriétés des objets, leurs types de données et leurs valeurs autorisées sont énumérés dans le schéma JSON ; nous vous recommandons donc de vous y familiariser afin de faciliter la configuration des outils d’analyse des fichiers JSON. Vous pouvez télécharger le schéma JSON pour les Skills OCR ici. L’objet racine décrit l’ensemble du document reconnu. Les informations générales sur le document sont stockées dans les objets layout et content. L’objet layout décrit les paramètres de l’image et tous les éléments graphiques et textuels détectés, tandis que l’objet content décrit les composants de données du document et leur place dans sa structure logique. Le tableau ci-dessous énumère toutes les propriétés de l’objet racine :
PropriétéType de donnéesDescription
version *stringLa version du document de schéma JSON. Valeur par défaut : Vantage OCR.Skill JSON output v1.0
producer *stringLa source du fichier JSON. Valeur par défaut : ABBYY Vantage OCR.Skill
languagesstring arrayListe de toutes les langues détectées dans le document.
layoutobjectStructure physique (mise en page) du document.
contentobjectContenu (structure logique du document).
  • Indique une propriété requise.