Exporter les valeurs des champs (onglet Fields)
| Format | Option d’export | Description | Nom du fichier |
|---|---|---|---|
| JSON | Valeurs, métadonnées et structure des champs pour chaque document | Résultats complets de l’extraction de données. Voir JSON Schema pour la structure de sortie. | <Applied_skill_name>.json |
| JSON | Valeurs uniquement | Valeurs des champs et erreurs de règles. Voir JSON Schema pour la structure de sortie. | <Applied_skill_name>_fields.json |
| CSV | Valeurs uniquement | Valeurs des champs. | <Applied_skill_name>.csv* |
Lors de l’exportation de champs image au format CSV, leurs valeurs dans le fichier CSV sont vides. Si une structure répétitive est imbriquée dans un groupe, son nom apparaît sous la forme
New Group/New Table, mais dans le nom du fichier enfant, la barre oblique est remplacée par un trait de soulignement (par exemple, New Group_New Table_055fe8c.csv).- Si un document contient des objets répétitifs (champs répétitifs, groupes répétitifs de champs, tableaux), ils sont exportés dans des fichiers distincts. La convention de nommage suivante est utilisée :
-
Fichier CSV parent :
<Applied_skill_name>.csv -
Fichiers CSV enfants pour les objets répétitifs :
<Field_path>_<random 7-character identifier>.csv -
Si le nom du fichier CSV enfant dépasse 250 caractères, la convention alternative est utilisée :
<Field_ID>_<random 7-character identifier>.csv
- Un suffixe numérique à partir de 2 est ajouté au nom du fichier CSV.
- Un sous-dossier est créé dans le dossier de la transaction pour les fichiers CSV enfants, nommé
<Applied_skill_name>_<N>ou<Applied_skill_name>_fields_<N>(si l’export JSON — Valeurs uniquement est activé), où N est le numéro séquentiel du document dans la transaction (à partir de 2 lorsqu’il y a plus d’un document). - Pour les objets répétitifs, le nom du fichier CSV enfant est indiqué dans la valeur du champ du fichier CSV parent.
- Les noms des champs sont inscrits sur la première ligne.
- Les colonnes sont séparées par des virgules.
- L’encodage est UTF-8 avec BOM.
- Les instances vides de champs ou de groupes répétitifs, ainsi que les lignes de tableau vides, ne sont pas exportées — le CSV obtenu ne contient aucune ligne vide.
Exporter le texte du document (onglet Text)
| Format | Option d’export | Description | Nom de fichier |
|---|---|---|---|
| JSON | Texte uniquement | Fichier JSON contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée. | <Applied_skill_name>_text.json |
| JSON | Conserver la structure du document | Fichier JSON contenant le texte reconnu avec la mise en page du document conservée. | <Applied_skill_name>_text.json |
| XML | Texte uniquement | Fichier XML contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée. | <Applied_skill_name>.xml |
| XML | Conserver la structure du document | Fichier XML contenant le texte reconnu avec la mise en page du document conservée. | <Applied_skill_name>.xml |
| ALTOXML | Texte uniquement | Fichier ALTO XML (schéma 4.2) contenant uniquement le texte reconnu ; la mise en page du document n’est pas conservée. | <Applied_skill_name>.xml |
| ALTOXML | Conserver la structure du document | Fichier ALTO XML (schéma 4.2) contenant le texte reconnu avec la mise en page du document conservée. | <Applied_skill_name>.xml |
| TXT | Document texte brut. La structure du document d’origine est conservée à l’aide d’espaces. | <Applied_skill_name>.txt | |
| DOCX | Modifiable | Document Word modifiable qui peut ne pas reproduire exactement l’original. | <Applied_skill_name>.docx |
| DOCX | Exact | Document Word non modifiable. La structure du document d’origine est entièrement conservée. | <Applied_skill_name>.docx |
| XLSX | Document Excel modifiable. La structure du document d’origine est conservée. | <Applied_skill_name>.xlsx | |
| PPTX | Document PowerPoint modifiable. La structure du document d’origine est conservée. | <Applied_skill_name>.pptx | |
| HTML | Document HTML qui conserve la structure du document d’origine. | <Applied_skill_name>.html |
Le choix de Texte uniquement pour JSON, XML ou ALTOXML rend impossible l’exportation vers DOCX, XLSX et PPTX.
Les options d’export (Texte uniquement et Conserver la structure du document) pour JSON, XML et ALTOXML ne peuvent pas être différentes. Si vous définissez une option pour l’un de ces formats, la même option sera appliquée aux autres.
Le texte exporté reflète les modifications des valeurs de champ effectuées par l’opérateur de relecture manuelle durant la relecture manuelle.
Exporter les images du document (onglet Image)
| Format | Option d’exportation | Description | Nom de fichier |
|---|---|---|---|
| PDF/A-3a | Un fichier PDF avec un calque de texte superposé à l’image du document. Reflète les modifications de la relecture manuelle. | <Applied_skill_name>.pdf | |
| PDF/A-3b | Un fichier PDF avec un calque de texte superposé à l’image du document. Reflète les modifications de la relecture manuelle. | <Applied_skill_name>.pdf | |
| Image uniquement | Un PDF non modifiable au format PDF/A-3b, sans calque de texte. | <Applied_skill_name>.pdf | |
| TIFF | Une image améliorée au format TIFF. | <Applied_skill_name>.tiff | |
| JPEG | Qualité maximale | Une image JPEG améliorée avec une qualité de 95 %. | pages/page_<N>.jpg |
| JPEG | Fichier plus petit | Une image JPEG améliorée avec une qualité de 75 % — tout en restant lisible, avec une taille de fichier réduite. | pages/page_<N>.jpg |
- Le nom du sous-dossier est
<Applied_skill_name>_<N>, ou<Applied_skill_name>_fields_<N>si l’option Valeurs uniquement de l’export JSON est activée. N est le numéro séquentiel du document dans la transaction (à partir de 2 lorsqu’il y a plus d’un document). - Dans le sous-dossier, un sous-dossier
Pagescontient les fichiers JPG, nomméspage_<N>.jpg, où N est le numéro de page. - Les fichiers PDF et TIFF sont enregistrés dans le dossier de la transaction.
- Des suffixes numériques à partir de 2 sont ajoutés aux noms de fichiers lorsqu’il y a plus d’un document du même type.
Schéma général de dénomination
<Applied_skill_name> dans leur nom, qui correspond à l’une des options suivantes :
- Le nom de la dernière Compétence de document appliquée au document.
- Le nom de la dernière Skill de classification appliquée, si aucune Compétence de document n’a été appliquée.
Unknownsi aucune Compétence de document ni Skill de classification n’a été appliquée, même si au moins l’une d’elles existe dans le flux de la Compétence de processus.
Sortie d’erreur
Error.json contenant :
- ID de transaction
- Statut de la transaction (
Failed) - Message d’erreur
- Tableau de tous les identifiants et noms des fichiers sources de la transaction
Les données exportées sont conservées par défaut pendant 2 semaines, conformément à la politique de conservation.
Activité Output
Présentation de l’activité Output et des destinations prises en charge.
Export vers un dossier partagé
Envoi des résultats de traitement vers un dossier partagé accessible via SFTP.
Export vers un système externe
Export des résultats vers un système tiers à l’aide d’un script personnalisé.
JSON Schema
Structure de la sortie JSON produite pour chaque transaction.
XML Schema
Structure de la sortie XML produite pour chaque transaction.
