Passer au contenu principal
Vantage propose les options d’export suivantes pour les champs de document, le texte et les images.

Exporter les valeurs des champs (onglet Fields)

FormatOption d’exportDescriptionNom du fichier
JSONValeurs, métadonnées et structure des champs pour chaque documentRésultats complets de l’extraction de données. Voir JSON Schema pour la structure de sortie.<Applied_skill_name>.json
JSONValeurs uniquementValeurs des champs et erreurs de règles. Voir JSON Schema pour la structure de sortie.<Applied_skill_name>_fields.json
CSVValeurs uniquementValeurs des champs.<Applied_skill_name>.csv*
Lors de l’exportation de champs image au format CSV, leurs valeurs dans le fichier CSV sont vides. Si une structure répétitive est imbriquée dans un groupe, son nom apparaît sous la forme New Group/New Table, mais dans le nom du fichier enfant, la barre oblique est remplacée par un trait de soulignement (par exemple, New Group_New Table_055fe8c.csv).
  • Si un document contient des objets répétitifs (champs répétitifs, groupes répétitifs de champs, tableaux), ils sont exportés dans des fichiers distincts. La convention de nommage suivante est utilisée :
  • Fichier CSV parent : <Applied_skill_name>.csv
  • Fichiers CSV enfants pour les objets répétitifs : <Field_path>_<random 7-character identifier>.csv
  • Si le nom du fichier CSV enfant dépasse 250 caractères, la convention alternative est utilisée : <Field_ID>_<random 7-character identifier>.csv
Lors de l’exportation vers un dossier partagé, le fichier CSV parent est enregistré dans le dossier de la transaction. S’il y a plusieurs documents du même type dans la transaction et qu’un fichier CSV distinct est généré pour chaque document :
  • Un suffixe numérique à partir de 2 est ajouté au nom du fichier CSV.
  • Un sous-dossier est créé dans le dossier de la transaction pour les fichiers CSV enfants, nommé <Applied_skill_name>_<N> ou <Applied_skill_name>_fields_<N> (si l’export JSON — Valeurs uniquement est activé), où N est le numéro séquentiel du document dans la transaction (à partir de 2 lorsqu’il y a plus d’un document).
  • Pour les objets répétitifs, le nom du fichier CSV enfant est indiqué dans la valeur du champ du fichier CSV parent.
Le fichier CSV est formaté comme suit :
  • Les noms des champs sont inscrits sur la première ligne.
  • Les colonnes sont séparées par des virgules.
  • L’encodage est UTF-8 avec BOM.
  • Les instances vides de champs ou de groupes répétitifs, ainsi que les lignes de tableau vides, ne sont pas exportées — le CSV obtenu ne contient aucune ligne vide.

Exporter le texte du document (onglet Text)

FormatOption d’exportDescriptionNom de fichier
JSONTexte uniquementFichier JSON contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée.<Applied_skill_name>_text.json
JSONConserver la structure du documentFichier JSON contenant le texte reconnu avec la mise en page du document conservée.<Applied_skill_name>_text.json
XMLTexte uniquementFichier XML contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée.<Applied_skill_name>.xml
XMLConserver la structure du documentFichier XML contenant le texte reconnu avec la mise en page du document conservée.<Applied_skill_name>.xml
ALTOXMLTexte uniquementFichier ALTO XML (schéma 4.2) contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée.<Applied_skill_name>.xml
ALTOXMLConserver la structure du documentFichier ALTO XML (schéma 4.2) contenant le texte reconnu avec la mise en page du document conservée.<Applied_skill_name>.xml
TXTDocument texte brut. La structure du document d’origine est conservée à l’aide d’espaces.<Applied_skill_name>.txt
DOCXModifiableDocument Word modifiable qui peut ne pas reproduire exactement l’original.<Applied_skill_name>.docx
DOCXExactDocument Word non modifiable. La structure du document d’origine est entièrement conservée.<Applied_skill_name>.docx
XLSXDocument Excel modifiable. La structure du document d’origine est conservée.<Applied_skill_name>.xlsx
PPTXDocument PowerPoint modifiable. La structure du document d’origine est conservée.<Applied_skill_name>.pptx
HTMLDocument HTML qui conserve la structure du document d’origine.<Applied_skill_name>.html
Le choix de Texte uniquement pour JSON, XML ou ALTOXML rend impossible l’exportation vers DOCX, XLSX et PPTX.
Les options d’export (Texte uniquement et Conserver la structure du document) pour JSON, XML et ALTOXML ne peuvent pas être différentes. Si vous définissez une option pour l’un de ces formats, la même option sera appliquée aux autres.
Le texte exporté reflète les modifications des valeurs de champ effectuées par l’opérateur de relecture manuelle durant la relecture manuelle.
Lors de l’export vers un dossier partagé, tous les fichiers sont enregistrés dans le dossier de la transaction. Des suffixes numériques à partir de 2 sont ajoutés aux noms de fichier s’il y a plusieurs documents du même type dans la transaction.

Exporter les images du document (onglet Image)

FormatOption d’exportationDescriptionNom de fichier
PDFPDF/A-3aUn fichier PDF avec un calque de texte superposé à l’image du document. Reflète les modifications de la relecture manuelle.<Applied_skill_name>.pdf
PDFPDF/A-3bUn fichier PDF avec un calque de texte superposé à l’image du document. Reflète les modifications de la relecture manuelle.<Applied_skill_name>.pdf
PDFImage uniquementUn PDF non modifiable au format PDF/A-3b, sans calque de texte.<Applied_skill_name>.pdf
TIFFUne image améliorée au format TIFF.<Applied_skill_name>.tiff
JPEGQualité maximaleUne image JPEG améliorée avec une qualité de 95 %.pages/page_<N>.jpg
JPEGFichier plus petitUne image JPEG améliorée avec une qualité de 75 % — tout en restant lisible, avec une taille de fichier réduite.pages/page_<N>.jpg
Pour chaque option d’exportation PDF, vous pouvez choisir entre Fichier plus petit (par défaut) et Qualité maximale. L’option Fichier plus petit utilise la compression Mixed Raster Content (MRC), qui sélectionne séparément la compression optimale pour le texte, les images et l’arrière-plan. Lors de l’exportation vers un dossier partagé, un sous-dossier est créé pour chaque document de la transaction :
  • Le nom du sous-dossier est <Applied_skill_name>_<N>, ou <Applied_skill_name>_fields_<N> si l’option Valeurs uniquement de l’export JSON est activée. N est le numéro séquentiel du document dans la transaction (à partir de 2 lorsqu’il y a plus d’un document).
  • Dans le sous-dossier, un sous-dossier Pages contient les fichiers JPG, nommés page_<N>.jpg, où N est le numéro de page.
  • Les fichiers PDF et TIFF sont enregistrés dans le dossier de la transaction.
  • Des suffixes numériques à partir de 2 sont ajoutés aux noms de fichiers lorsqu’il y a plus d’un document du même type.

Schéma général de dénomination

La plupart des fichiers exportés contiennent <Applied_skill_name> dans leur nom, qui correspond à l’une des options suivantes :
  • Le nom de la dernière Compétence de document appliquée au document.
  • Le nom de la dernière Skill de classification appliquée, si aucune Compétence de document n’a été appliquée.
  • Unknown si aucune Compétence de document ni Skill de classification n’a été appliquée, même si au moins l’une d’elles existe dans le flux de la Compétence de processus.
S’il y a plusieurs fichiers de sortie et que l’export vers un dossier partagé est configuré, des numéros incrémentés sont ajoutés aux noms de fichier afin de rendre chaque nom unique.

Sortie d’erreur

Si une transaction ne se termine pas correctement, Vantage génère un fichier Error.json contenant :
  • ID de transaction
  • Statut de la transaction (Failed)
  • Message d’erreur
  • Tableau de tous les identifiants et noms des fichiers sources de la transaction
Les données exportées sont conservées par défaut pendant 2 semaines, conformément à la politique de conservation.

Activité Output

Présentation de l’activité Output et des destinations prises en charge.

Export vers un dossier partagé

Envoi des résultats de traitement vers un dossier partagé accessible via SFTP.

Export vers un système externe

Export des résultats vers un système tiers à l’aide d’un script personnalisé.

JSON Schema

Structure de la sortie JSON produite pour chaque transaction.

XML Schema

Structure de la sortie XML produite pour chaque transaction.