Optionen zum Exportieren extrahierter Feldwerte (Registerkarte Fields)
| Format | Exportoption | Beschreibung | Dateiname |
|---|---|---|---|
| JSON | Werte, Metadaten und Feldstruktur für jedes Dokument | Vollständige Ergebnisse der Datenextraktion. Die Struktur der Ausgabedatei ist im Developer’s Guide beschrieben. | <Applied_skill_name>.json |
| JSON | Nur Werte | Feldwerte und Regelfehler. Die Struktur der Ausgabedatei ist im Developer’s Guide beschrieben. | <Applied_skill_name>_fields.json |
| CSV | Nur Werte | Feldwerte. Hinweis: Beim Exportieren von Bildfeldern sind deren Werte in der CSV-Datei leer. Wenn eine wiederholbare Struktur innerhalb einer Gruppe verschachtelt ist, erscheint ihr Name als „New Group/New Table“, im Namen einer untergeordneten Datei wird der Schrägstrich jedoch durch einen Unterstrich ersetzt (zum Beispiel New Group_New Table_055fe8c.csv). | <Applied_skill_name>.csv* |
- Name der übergeordneten CSV-Datei:
<Applied_skill_name>.csv - Name der untergeordneten CSV-Dateien für wiederholbare Objekte:
<Field_path>_<random 7-character identifier>.csv - Wenn der Name der untergeordneten CSV-Datei länger als 250 Zeichen ist, wird ein alternatives Benennungsschema verwendet:
<Field_ID>_<random 7-character identifier>.csv
- Dem Namen der CSV-Datei wird ein numerischer Postfix beginnend mit 2 hinzugefügt.
- Im Transaction-Ordner wird für untergeordnete CSV-Dateien ein Unterordner erstellt.
- Der Unterordner wird wie folgt benannt:
<Applied_skill_name>_<N>oder<Applied_skill_name>_fields_<N>(wenn JSON-Export – Nur Werte aktiviert ist), wobei N die fortlaufende Nummer des Dokuments im Vorgang ist (beginnend mit 2, wenn mehr als ein Dokument im Vorgang vorhanden ist). - Für wiederholbare Objekte wird der Name der untergeordneten CSV-Datei im Feldwert der übergeordneten CSV-Datei angegeben.
- Die Feldnamen stehen in der ersten Zeile der CSV-Datei.
- Die Spalten werden durch Kommas getrennt.
- Die verwendete Codierung ist UTF-8 mit BOM.
- Leere Instanzen wiederholbarer Felder oder Gruppen bzw. leere Tabellenzeilen werden nicht exportiert, das heißt, die resultierende CSV-Datei enthält keine leeren Zeilen.
Optionen zum Exportieren von Dokumenttext (Registerkarte Text)
| Format | Exportoption | Beschreibung | Dateiname |
|---|---|---|---|
| JSON | Nur Text | Eine JSON-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich. | <Applied_skill_name>_text.json |
| JSON | Dokumentenstruktur beibehalten | Eine JSON-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält. | <Applied_skill_name>_text.json |
| XML | Nur Text | Eine XML-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich. | <Applied_skill_name>.xml |
| XML | Dokumentenstruktur beibehalten | Eine XML-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält. | <Applied_skill_name>.xml |
| ALTOXML | Nur Text | Eine ALTO-XML-Datei, die nur erkannten Text enthält; das Dokumentlayout wird nicht beibehalten. Die Datei entspricht dem ALTO-Standard, Schemakompatibilität Version 4.2. Hinweis: Die Auswahl dieser Option macht den Export nach DOCX, XLSX und PPTX unmöglich. | <Applied_skill_name>.xml |
| ALTOXML | Dokumentenstruktur beibehalten | Eine ALTO-XML-Datei, die erkannten Text mit beibehaltener Dokumentstruktur enthält. Die Datei entspricht dem ALTO-Standard, Schemakompatibilität Version 4.2. | <Applied_skill_name>.xml |
| TXT | Ein Textdokument im Klartext. Die ursprüngliche Dokumentstruktur wird mithilfe von Leerzeichen beibehalten. | <Applied_skill_name>.txt | |
| DOCX | Editierbar | Ein bearbeitbares Word-Dokument, das möglicherweise nicht exakt wie das Original aussieht. | <Applied_skill_name>.docx |
| DOCX | Exakt | Ein nicht bearbeitbares Word-Dokument. Die ursprüngliche Dokumentstruktur bleibt vollständig erhalten. | <Applied_skill_name>.docx |
| XLSX | Ein bearbeitbares Excel-Dokument. Die ursprüngliche Dokumentstruktur bleibt erhalten. | <Applied_skill_name>.xlsx | |
| PPTX | Ein bearbeitbares PowerPoint-Dokument. Die ursprüngliche Dokumentstruktur bleibt erhalten. | <Applied_skill_name>.pptx | |
| HTML | Ein HTML-Dokument, das die ursprüngliche Dokumentstruktur beibehält. | <Applied_skill_name>.html |
Hinweis: Die Exportoptionen (Nur Text und Dokumentenstruktur beibehalten) für JSON, XML und ALTOXML können nicht voneinander abweichen. Wenn Sie für eines dieser Formate eine andere Exportoption angeben, wird diese Option auch auf die anderen Formate angewendet.
Optionen für den Export des Dokumentbilds (Registerkarte Bild)
| Format | Exportoption | Beschreibung | Dateiname |
|---|---|---|---|
| PDF/A-3a | Eine PDF-Datei mit einer Textebene über dem Dokumentbild. Die Textebene spiegelt Feldwertänderungen wider, die der Operator der Manuellen Überprüfung während der manuellen Überprüfung vorgenommen hat. | <Applied_skill_name>.pdf | |
| PDF/A-3b | Eine PDF-Datei mit einer Textebene über dem Dokumentbild. Die Textebene spiegelt Feldwertänderungen wider, die der Operator der Manuellen Überprüfung während der manuellen Überprüfung vorgenommen hat. | <Applied_skill_name>.pdf | |
| Nur Bild | Ein nicht bearbeitbares PDF im Standard PDF/A-3b ohne Textebene. | <Applied_skill_name>.pdf | |
| TIFF | Eine Datei, die ein optimiertes Bild im TIFF-Format enthält. | <Applied_skill_name>.tiff | |
| JPEG | Maximale Qualität | Eine Datei, die ein optimiertes Bild im JPEG-Format enthält. Wenn Sie diese Kompressionsoption wählen, wird die Bildqualität auf 95 % festgelegt. | pages/page_<N>.jpg |
| JPEG | Kleinere Dateigröße | Eine Datei, die ein optimiertes Bild im JPEG-Format enthält. Wenn Sie diese Kompressionsoption wählen, wird die Bildqualität auf 75 % festgelegt. So können Sie das Bild lesbar speichern und gleichzeitig die Dateigröße reduzieren. | pages/page_<N>.jpg |
Hinweis: Für jede PDF-Exportoption können Sie zwischen „kleinere Dateigröße“ (Standard) und „maximale Qualität“ wählen. Eine kleinere Dateigröße wird durch Mixed Raster Content (MRC)-Kompression erreicht, die optimale Kompressionsraten getrennt für Text, Bilder und Hintergrund bestimmt.Beim Export in einen freigegebenen Ordner wird für jedes Dokument im Vorgang ein Unterordner erstellt. Es gelten die folgenden Regeln und das folgende Benennungsschema:
- Der Unterordner wird wie folgt benannt:
<Applied_skill_name>_<N>oder<Applied_skill_name>_fields_<N>(wenn JSON-Export – Nur Werte aktiviert ist). N ist die fortlaufende Nummer des Dokuments im Vorgang (beginnend mit 2, wenn es mehr als ein Dokument im Vorgang gibt). - In diesem Unterordner wird ein Unterordner Pages erstellt, in dem die JPG-Dateien gespeichert werden. Die Dateinamen sind
page_<N>.jpg, wobei N die fortlaufende Nummer der Seite ist. - PDF- und TIFF-Dateien werden im Vorgangsordner gespeichert.
- Wenn es mehr als ein Dokument desselben Typs im Vorgang gibt, werden numerische Suffixe ab 2 an die Dateinamen angehängt.
Allgemeines Benennungsschema
<Applied_skill_name> in ihrem Namen; dies steht für eines der folgenden:
- Den Namen des zuletzt auf das Dokument angewendeten Document-Skills.
- Den Namen des zuletzt auf das Dokument angewendeten Klassifizierungs‑Skills, falls keine Document‑Skills angewendet wurden.
- „Unknown“, wenn keine Document‑ oder Klassifizierungs‑Skills angewendet wurden, während mindestens einer von ihnen im Process‑Skill‑Flow vorhanden ist.
Vorgänge mit Fehlern
Error.json. Sie enthält eine JSON-string mit folgenden Informationen zum Vorgang:
- Die Vorgangskennung
- Der Vorgangsstatus (Failed)
- Die Fehlermeldung
- Ein Array mit allen IDs und Namen der Quelldateien im Vorgang
