Passer au contenu principal
Dans ABBYY Vantage, les résultats de traitement et de reconnaissance optique de caractères (OCR) sont disponibles aux formats JSON et XML : Vantage génère un fichier JSON ou XML distinct, ou un ensemble de tels fichiers, pour chaque document traité, en fonction de la compétence appliquée au document et des paramètres de l’activité Output lorsqu’une Compétence de processus est utilisée. Le tableau suivant décrit les types de fichiers de sortie disponibles dans Vantage. Tous ces types de fichiers font partie de l’énumérateur ResultFileType dans l’API Vantage.
Type de fichierDescription
JsonDonnées extraites, telles que les valeurs de champs, la structure des champs et les erreurs de contrôle des règles.
PdfDocument PDF avec ou sans couche de texte.
TextDonnées texte extraites au format TXT.
DocxDonnées texte et image extraites au format DOCX.
XlsxDonnées texte et image extraites au format XLSX.
OcrJsonDonnées de reconnaissance plein texte au format JSON.
FieldsJsonFichier JSON simplifié. Contient uniquement les valeurs de champs et les erreurs de contrôle des règles.
FieldPictureChamps image extraits au format JPG.
XmlDonnées de reconnaissance plein texte extraites.
TiffDonnées d’image extraites au format TIFF.
JpegDonnées d’image extraites au format JPG.
CsvValeurs extraites de champs répétés ou non répétés.
HtmlDonnées de reconnaissance plein texte extraites au format HTML.
PptxDonnées texte et image extraites au format PPTX.
AltoDonnées de reconnaissance plein texte extraites au format XML correspondant à la norme ALTO, version de schéma 4.2.
Lorsque vous utilisez l’API Vantage, vous pouvez obtenir des informations sur les fichiers de sortie de la transaction traitée à l’aide de la requête GET https://your-server/api/publicapi/v1/transactions/transaction-id. Le type de fichier se trouve dans la propriété type de chaque objet dans le tableau resultFile. Pour plus d’informations sur les types de fichiers, consultez l’activité Output et Image (FieldPicture).