Zum Hauptinhalt springen
Vantage bietet die folgenden Exportoptionen für Dokumentfelder, Text und Bilder.

Optionen zum Exportieren extrahierter Feldwerte (Registerkarte Fields)

FormatExportoptionBeschreibungDateiname
JSONWerte, Metadaten und Feldstruktur für jedes DokumentVollständige Ergebnisse der Datenextraktion. Die Struktur der Ausgabedatei ist im Developer’s Guide beschrieben.<Applied_skill_name>.json
JSONNur WerteFeldwerte und Regelfehler. Die Struktur der Ausgabedatei ist im Developer’s Guide beschrieben.<Applied_skill_name>_fields.json
CSVNur WerteFeldwerte. Hinweis: Beim Exportieren von Bildfeldern sind deren Werte in der CSV-Datei leer. Wenn eine wiederholbare Struktur innerhalb einer Gruppe verschachtelt ist, erscheint ihr Name als „New Group/New Table“, im Namen einer untergeordneten Datei wird der Schrägstrich jedoch durch einen Unterstrich ersetzt (zum Beispiel New Group_New Table_055fe8c.csv).<Applied_skill_name>.csv*
*Wenn ein Dokument wiederholbare Objekte enthält (wiederholbare Felder, wiederholbare Feldgruppen, Tabellen), werden diese als separate Dateien exportiert. Es wird folgendes Benennungsschema verwendet:
  • Name der übergeordneten CSV-Datei: <Applied_skill_name>.csv
  • Name der untergeordneten CSV-Dateien für wiederholbare Objekte: <Field_path>_<random 7-character identifier>.csv
  • Wenn der Name der untergeordneten CSV-Datei länger als 250 Zeichen ist, wird ein alternatives Benennungsschema verwendet: <Field_ID>_<random 7-character identifier>.csv
Beim Export in einen freigegebenen Ordner wird die übergeordnete CSV-Datei im Transaction-Ordner gespeichert. Wenn es mehrere Dokumente desselben Typs im Vorgang gibt und für jedes Dokument eine separate CSV-Datei erzeugt wird, gelten die folgenden Regeln und das folgende Benennungsschema:
  • Dem Namen der CSV-Datei wird ein numerischer Postfix beginnend mit 2 hinzugefügt.
  • Im Transaction-Ordner wird für untergeordnete CSV-Dateien ein Unterordner erstellt.
  • Der Unterordner wird wie folgt benannt: <Applied_skill_name>_<N> oder <Applied_skill_name>_fields_<N> (wenn JSON-Export – Nur Werte aktiviert ist), wobei N die fortlaufende Nummer des Dokuments im Vorgang ist (beginnend mit 2, wenn mehr als ein Dokument im Vorgang vorhanden ist).
  • Für wiederholbare Objekte wird der Name der untergeordneten CSV-Datei im Feldwert der übergeordneten CSV-Datei angegeben.
Die CSV-Datei ist wie folgt formatiert:
  • Die Feldnamen stehen in der ersten Zeile der CSV-Datei.
  • Die Spalten werden durch Kommas getrennt.
  • Die verwendete Codierung ist UTF-8 mit BOM.
  • Leere Instanzen wiederholbarer Felder oder Gruppen bzw. leere Tabellenzeilen werden nicht exportiert, das heißt, die resultierende CSV-Datei enthält keine leeren Zeilen.

Optionen zum Exportieren von Dokumenttext (Registerkarte Text)

FormatExportoptionBeschreibungDateiname
JSONNur TextEine JSON-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich.<Applied_skill_name>_text.json
JSONDokumentenstruktur beibehaltenEine JSON-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält.<Applied_skill_name>_text.json
XMLNur TextEine XML-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich.<Applied_skill_name>.xml
XMLDokumentenstruktur beibehaltenEine XML-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält.<Applied_skill_name>.xml
ALTOXMLNur TextEine ALTO-XML-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Die Datei entspricht dem ALTO-Standard, Schemakompatibilität Version 4.2. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich.<Applied_skill_name>.xml
ALTOXMLDokumentenstruktur beibehaltenEine ALTO-XML-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält. Die Datei entspricht dem ALTO-Standard, Schemakompatibilität Version 4.2.<Applied_skill_name>.xml
TXTEin Textdokument im Klartext. Die ursprüngliche Dokumentstruktur wird mithilfe von Leerzeichen beibehalten.<Applied_skill_name>.txt
DOCXEditierbarEin bearbeitbares Word-Dokument, das möglicherweise nicht exakt wie das Original aussieht.<Applied_skill_name>.docx
DOCXExaktEin nicht bearbeitbares Word-Dokument. Die ursprüngliche Dokumentstruktur bleibt vollständig erhalten.<Applied_skill_name>.docx
XLSXEin bearbeitbares Excel-Dokument. Die ursprüngliche Dokumentstruktur bleibt erhalten.<Applied_skill_name>.xlsx
PPTXEin bearbeitbares PowerPoint-Dokument. Die ursprüngliche Dokumentstruktur bleibt erhalten.<Applied_skill_name>.pptx
HTMLEin HTML-Dokument, das die ursprüngliche Dokumentstruktur beibehält.<Applied_skill_name>.html
Beim Export in einen freigegebenen Ordner werden alle Dateien im Vorgangsordner gespeichert. Wenn es mehr als ein Dokument desselben Typs im Vorgang gibt, werden numerische Postfixe ab 2 an die Dateinamen angehängt. Der exportierte Text berücksichtigt Feldwertänderungen, die der Operator der Manuellen Überprüfung während der manuellen Überprüfung vorgenommen hat.
Hinweis: Die Exportoptionen (Nur Text und Dokumentenstruktur beibehalten) für JSON, XML und ALTOXML können nicht voneinander abweichen. Wenn Sie für eines dieser Formate eine andere Exportoption angeben, wird diese Option auch auf die anderen Formate angewendet.

Optionen für den Export des Dokumentbilds (Registerkarte Bild)

FormatExportoptionBeschreibungDateiname
PDFPDF/A-3aEine PDF-Datei mit einer Textebene über dem Dokumentbild. Die Textebene spiegelt Feldwertänderungen wider, die der Operator der Manuellen Überprüfung während der manuellen Überprüfung vorgenommen hat.<Applied_skill_name>.pdf
PDFPDF/A-3bEine PDF-Datei mit einer Textebene über dem Dokumentbild. Die Textebene spiegelt Feldwertänderungen wider, die der Operator der Manuellen Überprüfung während der manuellen Überprüfung vorgenommen hat.<Applied_skill_name>.pdf
PDFNur BildEin nicht bearbeitbares PDF im Standard PDF/A-3b ohne Textebene.<Applied_skill_name>.pdf
TIFFEine Datei, die ein optimiertes Bild im TIFF-Format enthält.<Applied_skill_name>.tiff
JPEGMaximale QualitätEine Datei, die ein optimiertes Bild im JPEG-Format enthält. Wenn Sie diese Kompressionsoption wählen, wird die Bildqualität auf 95 % festgelegt.pages/page_<N>.jpg
JPEGKleinere DateigrößeEine Datei, die ein optimiertes Bild im JPEG-Format enthält. Wenn Sie diese Kompressionsoption wählen, wird die Bildqualität auf 75 % festgelegt. So können Sie das Bild lesbar speichern und gleichzeitig die Dateigröße reduzieren.pages/page_<N>.jpg
Hinweis: Für jede PDF-Exportoption können Sie zwischen „kleinere Dateigröße“ (Standard) und „maximale Qualität“ wählen. Eine kleinere Dateigröße wird durch Mixed Raster Content (MRC)-Kompression erreicht, die optimale Kompressionsraten getrennt für Text, Bilder und Hintergrund bestimmt.
Beim Export in einen freigegebenen Ordner wird für jedes Dokument im Vorgang ein Unterordner erstellt. Es gelten die folgenden Regeln und das folgende Benennungsschema:
  • Der Unterordner wird wie folgt benannt: <Applied_skill_name>_<N> oder <Applied_skill_name>_fields_<N> (wenn JSON-Export – Nur Werte aktiviert ist). N ist die fortlaufende Nummer des Dokuments im Vorgang (beginnend mit 2, wenn es mehr als ein Dokument im Vorgang gibt).
  • In diesem Unterordner wird ein Unterordner Pages erstellt, in dem die JPG-Dateien gespeichert werden. Die Dateinamen sind page_<N>.jpg, wobei N die fortlaufende Nummer der Seite ist.
  • PDF- und TIFF-Dateien werden im Vorgangsordner gespeichert.
  • Wenn es mehr als ein Dokument desselben Typs im Vorgang gibt, werden numerische Suffixe ab 2 an die Dateinamen angehängt.

Allgemeines Benennungsschema

Die meisten exportierten Dateien enthalten <Applied_skill_name> in ihrem Namen; dies steht für eines der folgenden:
  • Den Namen des zuletzt auf das Dokument angewendeten Document-Skills.
  • Den Namen des zuletzt auf das Dokument angewendeten Klassifizierungs‑Skills, falls keine Document‑Skills angewendet wurden.
  • „Unknown“, wenn keine Document‑ oder Klassifizierungs‑Skills angewendet wurden, während mindestens einer von ihnen im Process‑Skill‑Flow vorhanden ist.
Wenn mehrere Ausgabedateien erzeugt werden und der Export in einen freigegebenen Ordner konfiguriert ist, werden zur eindeutigen Benennung fortlaufende Nummern an die Dateinamen angehängt.

Vorgänge mit Fehlern

Wenn ein Vorgang nicht erfolgreich abgeschlossen wird, erzeugt Vantage eine Datei Error.json. Sie enthält eine JSON-string mit folgenden Informationen zum Vorgang:
  • Die Vorgangskennung
  • Der Vorgangsstatus (Failed)
  • Die Fehlermeldung
  • Ein Array mit allen IDs und Namen der Quelldateien im Vorgang
Standardmäßig werden exportierte Daten gemäß der Aufbewahrungsrichtlinie 2 Wochen lang aufbewahrt.