Zum Hauptinhalt springen
Um eine Skill zu trainieren und zu testen, benötigen Sie einen Satz gekennzeichneter Dokumente, das heißt Dokumente, bei denen die Positionen der Felder und ihre Datentypen ausdrücklich angegeben sind. Der naheliegendste Weg, einen solchen Satz zu erhalten, besteht darin, einige Dokumente manuell zu kennzeichnen. Das kann jedoch zeitaufwendig sein – besonders, wenn Sie Deep Learning einsetzen möchten, das große Mengen gekennzeichneter Dokumente erfordert. Um Zeit und Aufwand zu sparen, bietet ABBYY mehrere Möglichkeiten, gekennzeichnete Dokumente aus anderen Skills oder aus manuell geprüften Verarbeitungsergebnissen wiederzuverwenden.

Dokumente manuell kennzeichnen

Kennzeichnen Sie jedes hochgeladene Dokument, indem Sie die Positionen aller Felder markieren und die Datentypen angeben, die sie voraussichtlich enthalten. Befolgen Sie diese Richtlinien, um verlässliche Trainingsergebnisse sicherzustellen.

Importieren von gekennzeichneten Dokumenten aus einem Ordner

Gekennzeichnete Dokumente können auch aus den folgenden Quellen stammen: In jedem Fall müssen Sie die gekennzeichneten Dokumente in einen Ordner exportieren. Anschließend können Sie die Dokumente mit Kennzeichnung aus diesem Ordner importieren und für das Training Ihres Skills verwenden.

Skill-Trainingssätze

Wenn Sie eine Skill für den Einsatz in der Produktion veröffentlichen, entfernen Sie in der Regel den Trainingssatz und lassen in der veröffentlichten Version nur einige Beispieldokumente zurück. Sie können Ihren Trainingssatz auch in einen Ordner exportieren, wenn Sie denselben Trainingssatz zum Trainieren einer neuen Version Ihrer Skill verwenden möchten. Um Dokumente und deren Labeling in einen Ordner zu exportieren, klicken Sie auf das Symbol „Weitere Optionen“ neben dem Namen des Dokumentensatzes und wählen Sie Satz mit Labeling exportieren. Der Zielordner enthält die folgenden Dateien und Unterordner:
  • documentdefinition.json.
  • skillsettings.json.
  • Einen Unterordner <Document name>, der Dokumentbilder sowie die Dateien documentinfo.json und labeling.json für jedes Dokument enthält.

Manuell überprüfte Verarbeitungsergebnisse

Wenn Verarbeitungsergebnisse von manuellen Prüfern korrigiert werden, wird ein Satz gelabelter Dokumente erstellt. Um solche gelabelten Dokumente wiederzuverwenden, richten Sie den Export der Felddaten nach JSON mit der Option Werte, Metadaten und Feldstruktur für jedes Dokument ein und exportieren Sie die Dokumentbilder in ein beliebiges Bildformat. Der Zielordner enthält einen separaten Unterordner für jeden Vorgang. Jeder <Transaction ID>-Unterordner enthält Folgendes:
  • Die Datei <Applied skill name>.json mit den Felddaten.
  • Exportierte Bilder, abhängig vom gewählten Format: <Applied skill name>.pdf, <Applied skill name>.tiff oder den Unterordner <Applied skill name>/Pages mit page_*.jpg-Dateien für jede Seite.

FlexiCapture

Sie können Dokumente wiederverwenden, die zuvor in FlexiCapture gelabelt wurden. Weitere Informationen finden Sie unter Importieren gelabelter Dokumente aus FlexiCapture.

Importieren

Um gelabelte Dokumente aus dem beim Export erstellten Ordner zu importieren, wählen Sie den Satz Alle Documents, öffnen Sie das Dropdown-Menü neben der Schaltfläche Hochladen und wählen Sie dann in der Liste die Option Gelabelte Dokumente aus Ordner importieren…. Wählen Sie anschließend den zuvor erstellten Ordner aus. Hinweis: Nehmen Sie keine Änderungen an dem Ordner vor, der beim Export erstellt wurde. Wenn Sie die Unterordnerstruktur ändern oder Dateien umbenennen, kann der Importvorgang fehlschlagen.

Wie Duplikate behandelt werden

Wenn eines der importierten Dokumente denselben Namen wie ein vorhandenes Dokument hat, fragt Advanced Designer, ob Sie die Beschriftung des vorhandenen Dokuments aktualisieren oder das Duplikat als neues Dokument importieren möchten. Wenn Sie Beschriftung aktualisieren auswählen:
  • Bei gleichnamigen Feldern werden deren Position und Einstellungen im vorhandenen Dokument durch die im importierten Dokument ersetzt.
  • Alle Felder, die im importierten Dokument vorhanden sind, im vorhandenen Dokument jedoch fehlen, werden dem vorhandenen Dokument hinzugefügt.
Wenn Sie Als neue Dokumente importieren auswählen, werden Duplikate umbenannt und mit ihrer Beschriftung unverändert importiert.