Um eine Seitenfolge aus einer Datei mit mehreren Dokumenten in separate, zur Verarbeitung bereite Dokumente aufzuteilen, erstellen Sie einen Document-Splitter-Skill. Document-Splitter-Skills können nur in Advanced Designer erstellt werden. Die folgenden Szenarien kombinieren die Aktivitäten Classify, Extraction Rules und Splitter Script, um Dokumentgrenzen zu erkennen.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Wählen Sie ein Szenario
| Szenario | Wann verwenden | Zentrale Aktivitäten |
|---|---|---|
| Dokumente desselben Typs in einem Stream | Mehrere Rechnungen in einer Datei | Extraction Rules + Splitter-Skript (+ Classify) |
| Dokumente trennen und Anhänge speichern | Dokumente haben erläuternde Anhangseiten, die beibehalten werden sollen | Classify + Splitter-Skript (+ Extraction Rules) |
| Dokumente trennen und ihren Typ bestimmen | Der Stream enthält Dokumente verschiedener Typen (z. B. ein Paket aus Darlehensantragsunterlagen) | Classify + Extraction Rules + Splitter-Skript |
| Seiten neu anordnen und bereinigen | Seiten kommen in der falschen Reihenfolge an, mit leeren oder Störseiten | Extraction Rules + Splitter-Skript |
Gleichartige Dokumente in einem Stream
- Fügen Sie eine Extraction Rules activity hinzu, um Rechnungsnummern und Seitenzahlen zu extrahieren.
- Fügen Sie eine Classify activity hinzu, wenn sich die erste Seite jedes Dokuments optisch von den anderen unterscheidet.
- Verwenden Sie die Splitter-Skript-Aktivität, um extrahierte Werte seitenübergreifend zu vergleichen und zu bestimmen, wo jedes neue Dokument beginnt.
Dokumente trennen und Anhänge speichern
- Verwenden Sie eine Classify activity, um jede Seite als Seite eines Hauptdokuments oder als Anhang zu kennzeichnen.
- Fügen Sie optional eine Extraction-Rules-Aktivität hinzu, um Seiten ohne extrahierbare Daten zu markieren — dabei handelt es sich wahrscheinlich um Anhänge.
- Verwenden Sie die Splitter-Skript-Aktivität, um jeden Anhang seinem übergeordneten Dokument zuzuordnen oder als separates Dokument auszugeben.
Dokumente trennen und ihren Typ bestimmen
- Verwenden Sie eine Classify activity, um jeder Seite einen Dokumenttyp zuzuweisen.
- Fügen Sie eine Extraction-Rules-Aktivität hinzu, um Daten zu extrahieren, die auf den Beginn eines neuen Dokuments hinweisen.
- Verwenden Sie die Splitter-Skript-Aktivität, um Regeln zum Segmentieren und Kennzeichnen jedes Ausgabedokuments zu definieren.
Seiten neu anordnen und bereinigen
- Fügen Sie ein Feld hinzu, um Seitenzahlen (oder ein anderes Ordnungssignal) zu extrahieren.
- Fügen Sie ein Feld hinzu, das erkennt, ob die Seite Text enthält — Seiten ohne Text können als leer oder als Störseiten behandelt werden.
- Verwenden Sie die Splitter-Skript-Aktivität, um die Seiten neu anzuordnen und leere/Störseiten in ein separates Ausgabedokument zu leiten.
Den Document-Splitter-Skill erstellen

Einen Document-Splitter-Skill erstellen
Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Splitter Skill.
Dokumente hochladen
Laden Sie auf der Registerkarte Documents Ihre Dateien hoch. Jeder Dokumentensatz sollte die Dateien für einen einzelnen Geschäftsvorgang enthalten. Die Quelldateien werden in einzelne Seiten umgewandelt — jede Aktivität außer der Splitter-Skript-Aktivität verarbeitet jede Seite einzeln.
Klassifizierungs- und Extraktionsaktivitäten hinzufügen
Konfigurieren Sie den Verarbeitungsablauf so, dass die Daten extrahiert werden, die benötigt werden, um Dokumentgrenzen und Dokumenttypen zu bestimmen. Fügen Sie eine Classify activity hinzu, wenn der Dokumentstrom mehrere Dokumenttypen enthält oder wenn sich die ersten Seiten optisch vom Rest unterscheiden. Fügen Sie nach Bedarf Felder und weitere Aktivitäten hinzu, um Daten zu erfassen, die dabei helfen, Dokumente desselben Typs zu trennen oder Dokumentklassen zu kennzeichnen.
Die Splitter-Skript-Aktivität konfigurieren
Fügen Sie im Bereich Splitter Script Properties Dokumenttypen hinzu und schreiben Sie dann das Skript, das den Seitenstrom in einen Dokumentensatz umwandelt. Das Skript hat Zugriff auf jede Seite im Vorgang und kann Daten lesen, die von anderen Aktivitäten erzeugt wurden, um zu entscheiden, welche Seiten den Beginn eines neuen Dokuments markieren.
Testen und veröffentlichen
Klicken Sie auf Test Skill Using Selected Documents, um die Ergebnisse auszuwerten. Wenn die Ergebnisse gut genug sind, veröffentlichen Sie den Skill.
Splitter-Skript-Aktivität
Definieren Sie Dokumentgrenzen durch die Analyse der aus jeder Seite extrahierten Daten.
Classify-Aktivitäten
Kennzeichnen Sie jede Seite mit ihrem Dokumenttyp oder ihrem Status als erste Seite.
Extraction-Rules-Aktivität
Extrahieren Sie Kennungen wie Seitenzahlen, Rechnungsnummern oder Dokument-Schlüsselwörter.
Document-Splitter-Skills
Referenz zu Struktur, Einstellungen und Veröffentlichung von Document-Splitter-Skills.
