Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Um eine Seitenfolge aus einer Datei mit mehreren Dokumenten in separate, zur Verarbeitung bereite Dokumente aufzuteilen, erstellen Sie einen Document-Splitter-Skill. Document-Splitter-Skills können nur in Advanced Designer erstellt werden. Die folgenden Szenarien kombinieren die Aktivitäten Classify, Extraction Rules und Splitter Script, um Dokumentgrenzen zu erkennen.

Wählen Sie ein Szenario

SzenarioWann verwendenZentrale Aktivitäten
Dokumente desselben Typs in einem StreamMehrere Rechnungen in einer DateiExtraction Rules + Splitter-Skript (+ Classify)
Dokumente trennen und Anhänge speichernDokumente haben erläuternde Anhangseiten, die beibehalten werden sollenClassify + Splitter-Skript (+ Extraction Rules)
Dokumente trennen und ihren Typ bestimmenDer Stream enthält Dokumente verschiedener Typen (z. B. ein Paket aus Darlehensantragsunterlagen)Classify + Extraction Rules + Splitter-Skript
Seiten neu anordnen und bereinigenSeiten kommen in der falschen Reihenfolge an, mit leeren oder StörseitenExtraction Rules + Splitter-Skript

Gleichartige Dokumente in einem Stream

Verwenden Sie dieses Szenario, wenn eine Datei mehrere Dokumente desselben Typs enthält — zum Beispiel einen Stapel Rechnungen eines Vendors für einen Abrechnungszeitraum. Jede Rechnung hat ihre eigene Nummer und kann Seitenzahlen tragen; verwenden Sie diese Daten, um Trennstellen zu erkennen.
  • Fügen Sie eine Extraction Rules activity hinzu, um Rechnungsnummern und Seitenzahlen zu extrahieren.
  • Fügen Sie eine Classify activity hinzu, wenn sich die erste Seite jedes Dokuments optisch von den anderen unterscheidet.
  • Verwenden Sie die Splitter-Skript-Aktivität, um extrahierte Werte seitenübergreifend zu vergleichen und zu bestimmen, wo jedes neue Dokument beginnt.

Dokumente trennen und Anhänge speichern

Verwenden Sie dieses Szenario, wenn Dokumente von erläuternden Seiten (Anhängen) begleitet werden, die beibehalten, aber nicht extrahiert werden sollen.
  • Verwenden Sie eine Classify activity, um jede Seite als Seite eines Hauptdokuments oder als Anhang zu kennzeichnen.
  • Fügen Sie optional eine Extraction-Rules-Aktivität hinzu, um Seiten ohne extrahierbare Daten zu markieren — dabei handelt es sich wahrscheinlich um Anhänge.
  • Verwenden Sie die Splitter-Skript-Aktivität, um jeden Anhang seinem übergeordneten Dokument zuzuordnen oder als separates Dokument auszugeben.

Dokumente trennen und ihren Typ bestimmen

Verwenden Sie dieses Szenario, wenn der Datenstrom Dokumente verschiedener Typen enthält — zum Beispiel Unterlagen für einen Kreditantrag mit Ausweisdokumenten, Einkommensnachweisen, Kontoauszügen und Rechnungen von Versorgungsunternehmen.

Seiten neu anordnen und bereinigen

Verwenden Sie dieses Szenario, wenn Seiten in der falschen Reihenfolge eintreffen oder leere bzw. Störseiten aus einem ungeordneten Scan enthalten sind. Eine Neuordnung ist nur möglich, wenn die Seiten ein Ordnungssignal tragen — zum Beispiel gedruckte Seitenzahlen.
  • Fügen Sie ein Feld hinzu, um Seitenzahlen (oder ein anderes Ordnungssignal) zu extrahieren.
  • Fügen Sie ein Feld hinzu, das erkennt, ob die Seite Text enthält — Seiten ohne Text können als leer oder als Störseiten behandelt werden.
  • Verwenden Sie die Splitter-Skript-Aktivität, um die Seiten neu anzuordnen und leere/Störseiten in ein separates Ausgabedokument zu leiten.

Den Document-Splitter-Skill erstellen

Verarbeitungsablauf des Document-Splitter-Skills mit den Aktivitäten Classify, Extraction Rules und Splitter Script
1

Einen Document-Splitter-Skill erstellen

Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Splitter Skill.
2

Dokumente hochladen

Laden Sie auf der Registerkarte Documents Ihre Dateien hoch. Jeder Dokumentensatz sollte die Dateien für einen einzelnen Geschäftsvorgang enthalten. Die Quelldateien werden in einzelne Seiten umgewandelt — jede Aktivität außer der Splitter-Skript-Aktivität verarbeitet jede Seite einzeln.
3

Klassifizierungs- und Extraktionsaktivitäten hinzufügen

Konfigurieren Sie den Verarbeitungsablauf so, dass die Daten extrahiert werden, die benötigt werden, um Dokumentgrenzen und Dokumenttypen zu bestimmen. Fügen Sie eine Classify activity hinzu, wenn der Dokumentstrom mehrere Dokumenttypen enthält oder wenn sich die ersten Seiten optisch vom Rest unterscheiden. Fügen Sie nach Bedarf Felder und weitere Aktivitäten hinzu, um Daten zu erfassen, die dabei helfen, Dokumente desselben Typs zu trennen oder Dokumentklassen zu kennzeichnen.
4

Die Splitter-Skript-Aktivität konfigurieren

Fügen Sie im Bereich Splitter Script Properties Dokumenttypen hinzu und schreiben Sie dann das Skript, das den Seitenstrom in einen Dokumentensatz umwandelt. Das Skript hat Zugriff auf jede Seite im Vorgang und kann Daten lesen, die von anderen Aktivitäten erzeugt wurden, um zu entscheiden, welche Seiten den Beginn eines neuen Dokuments markieren.
5

Testen und veröffentlichen

Klicken Sie auf Test Skill Using Selected Documents, um die Ergebnisse auszuwerten. Wenn die Ergebnisse gut genug sind, veröffentlichen Sie den Skill.

Splitter-Skript-Aktivität

Definieren Sie Dokumentgrenzen durch die Analyse der aus jeder Seite extrahierten Daten.

Classify-Aktivitäten

Kennzeichnen Sie jede Seite mit ihrem Dokumenttyp oder ihrem Status als erste Seite.

Extraction-Rules-Aktivität

Extrahieren Sie Kennungen wie Seitenzahlen, Rechnungsnummern oder Dokument-Schlüsselwörter.

Document-Splitter-Skills

Referenz zu Struktur, Einstellungen und Veröffentlichung von Document-Splitter-Skills.