Zum Hauptinhalt springen
In ABBYY Vantage sind Verarbeitungs- und Optical Character Recognition (OCR)-Ergebnisse in den Formaten JSON und XML verfügbar: Vantage generiert für jedes verarbeitete Dokument eine separate JSON- oder XML-Datei oder einen Satz solcher Dateien – abhängig vom auf das Dokument angewendeten Skill und den Einstellungen der Output activity, wenn ein Process-Skill verwendet wird. Die folgende Tabelle beschreibt die in Vantage verfügbaren Typen von Ausgabedateien. Alle diese Dateitypen sind Teil des ResultFileType-Enumerators in der Vantage-API.
File typeDescription
JsonExtrahierte Daten, wie zum Beispiel Feldwerte, Feldstrukturen und Regelprüfungsfehler.
PdfPDF-Dokument mit oder ohne Textebene.
TextExtrahierte Textdaten im TXT-Format.
DocxExtrahierte Text- und Bilddaten im DOCX-Format.
XlsxExtrahierte Text- und Bilddaten im XLSX-Format.
OcrJsonVolltexterkennungsdaten im JSON-Format.
FieldsJsonVereinfachte JSON-Datei. Enthält nur Feldwerte und Regelprüfungsfehler.
FieldPictureExtrahierte Bildfelder im JPG-Format.
XmlExtrahierte Volltexterkennungsdaten.
TiffExtrahierte Bilddaten im TIFF-Format.
JpegExtrahierte Bilddaten im JPG-Format.
CsvExtrahierte Datenwerte von wiederholenden oder nicht wiederholenden Feldern.
HtmlExtrahierte Volltexterkennungsdaten im HTML-Format.
PptxExtrahierte Text- und Bilddaten im PPTX-Format.
AltoExtraherte Volltexterkennungsdaten im XML-Format, die dem ALTO-Standard, Schemaversion 4.2, entsprechen.
Bei der Arbeit mit der Vantage-API können Sie Informationen über Ausgabedateien des verarbeiteten Vorgangs mit der Anfrage GET https://your-server/api/publicapi/v1/transactions/transaction-id abrufen. Der Dateityp befindet sich in der type-Eigenschaft jedes Objekts im resultFile-Array. Weitere Informationen zu Dateitypen finden Sie unter Output activity und Image (FieldPicture).