Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Ein strukturiertes Dokument hat ein festes Layout — die Felder befinden sich in jeder Instanz an derselben Stelle. Häufige Beispiele sind Fragebögen, Antragsformulare und Steuerformulare. Manche strukturierten Dokumente haben eine kleine Anzahl von Varianten mit geringfügig abweichenden Feldpositionen. Hintergrundinformationen finden Sie unter Daten aus Dokumenten in Advanced Designer extrahieren.
IRS Form 1040 (2020) — Beispiel für ein strukturiertes Dokument

Wo Sie den Skill erstellen

Sie können Skills für strukturierte Dokumente entweder im Skill Designer oder im Advanced Designer erstellen; bearbeiten können Sie sie jedoch nur im Advanced Designer.
  • Skill Designer (Cloud) — aktivieren Sie beim Skill den Schalter Fixed-form documents und laden Sie dann einige leere Formulare hoch und labeln Sie sie. Siehe Einrichten eines Document-Skills zur Verarbeitung strukturierter Dokumente. Der resultierende Skill enthält eine Forms-Aktivität, die sichtbar wird, wenn Sie den Skill später im Advanced Designer öffnen.
  • Advanced Designer (Windows-Desktop) — verwenden Sie ihn, wenn Sie die Forms-Aktivität mit anderen Vantage-Aktivitäten kombinieren müssen (siehe die folgenden Szenarien).
Wenn Sie den Schalter Fixed-form documents im Skill Designer nicht aktivieren, enthält der Verarbeitungsablauf des Skills nur eine Fast Learning-Aktivität.
Sobald der Ablauf eines Skills eine Forms-Aktivität zusammen mit anderen Aktivitäten umfasst oder mehrere Forms-Aktivitäten enthält, können Sie die Eigenschaften des Skills nur noch in Vantage ändern — Training und weitergehende Bearbeitungen müssen im Advanced Designer erfolgen.

Wählen Sie ein Szenario

SzenarioEinsatz, wennZentrale Aktivitäten
Formulare mit unstrukturierten ElementenDie Formulare enthalten außerdem Barcodes, Stempel oder Tabellen mit variabler LängeForms + Extraction Rules
Gemischte Formulare und unstrukturierte DokumenteDieselben Daten liegen entweder als Formulare oder als Freitext vorClassify + IF + Forms + Fast Learning

Formulare mit unstrukturierten Elementen

Einige strukturierte Dokumente enthalten unstrukturierte Elemente wie Barcodes oder Stempel, die an beliebiger Stelle auf der Seite platziert sein können, oder sie enthalten Tabellen mit variabler Zeilenanzahl zusätzlich zum festen Layout. Um sie zu verarbeiten, kombinieren Sie eine Forms-Aktivität mit einer Extraction Rules-Aktivität — Forms verarbeitet die strukturierten Felder, Extraction Rules die unstrukturierten Elemente (zum Beispiel Barcodes).
1

Einen Document-Skill erstellen

Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Document Skill.
2

Eine Forms-Aktivität hinzufügen und trainieren

Fügen Sie auf der Registerkarte Activities eine Forms-Aktivität hinzu. Laden Sie im Activity Editor auf der Registerkarte Blank Form pro Variante ein leeres Beispielformular hoch (empfohlen werden höchstens zehn Varianten) und kennzeichnen Sie die Felder, die Sie extrahieren möchten. Siehe Richtlinien zum Kennzeichnen. Klicken Sie auf Train Activity.
3

Die Forms-Aktivität testen

Öffnen Sie die Registerkarte Test Set, laden Sie ausgefüllte Testdokumente hoch, prüfen Sie, ob die Felder korrekt gekennzeichnet sind, und klicken Sie auf Test Activity. Überprüfen Sie die Ergebnisse.
4

Eine Extraction Rules-Aktivität hinzufügen und konfigurieren

Fügen Sie anschließend auf der Registerkarte Activities eine Extraction Rules-Aktivität hinzu und konfigurieren Sie sie im Activity Editor.
5

Testen und veröffentlichen

Klicken Sie auf Test Skill Using Selected Documents. Wenn die Ergebnisse akzeptabel sind, veröffentlichen Sie den Skill. Andernfalls passen Sie die Kennzeichnung an, trainieren erneut und testen noch einmal.
Tabellen und wiederholbare Gruppen. Forms-Aktivitäten können Tabellen und wiederholbare Gruppen nur extrahieren, wenn die maximale Zeilen- oder Instanzanzahl im Voraus bekannt ist und die Begrenzungen fest definiert sind. Kennzeichnen Sie jede Zeile, die in allen Formularvarianten vorkommen kann — in den Ergebnissen werden nur Zeilen mit Daten zurückgegeben. Derzeit unterstützen Forms-Tabellen nur Textwerte; verwenden Sie für Spalten mit Kontrollkästchen oder Barcodes stattdessen eine wiederholbare Gruppe. Wenn die Zeilenanzahl nicht im Voraus bekannt ist, verwenden Sie eine andere Vantage-Technologie.

Gemischte Formulare und unstrukturierte Dokumente

Einige Workflows erhalten dieselben Informationen entweder in einem gedruckten Formular oder in einem Dokument mit freiem Layout — zum Beispiel Fragebögen, die sowohl als ausgefüllte Formulare als auch als unstrukturierter Fließtext zurückgesendet werden. Kombinieren Sie eine Forms-Aktivität mit einer Fast Learning-Aktivität (oder Extraction Rules-Aktivität) und leiten Sie Dokumente mit einer Classify activity und einer IF-Aktivität an den richtigen Verarbeitungspfad weiter.
1

Einen Document-Skill erstellen

Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Document Skill.
2

Eine Forms-Aktivität hinzufügen und trainieren

Fügen Sie auf der Registerkarte Activities eine Forms-Aktivität hinzu. Laden Sie im Activity Editor auf der Registerkarte Blank Form ein leeres Beispielformular hoch und kennzeichnen Sie dessen Felder. Siehe Richtlinien zum Kennzeichnen. Klicken Sie auf Train Activity.
3

Die Forms-Aktivität testen

Öffnen Sie die Registerkarte Test Set, laden Sie ausgefüllte Testdokumente hoch, überprüfen Sie die Feldkennzeichnung und klicken Sie auf Test Activity. Prüfen Sie die Ergebnisse.
4

Eine Fast Learning-Aktivität hinzufügen und trainieren

Fügen Sie auf der Registerkarte Activities eine Fast Learning-Aktivität hinzu und konfigurieren und trainieren Sie sie im Activity Editor.
5

Am Anfang eine Classify activity hinzufügen

Fügen Sie am Anfang des Workflows eine Classify activity (Classify By Company oder Classify By Text and Image) hinzu. Erstellen Sie im Activity Editor für jede Dokumentvariante eine Klasse, weisen Sie Ihren Trainingsdokumenten Klassen zu und trainieren Sie die Aktivität.
6

Den Workflow mit einer IF-Aktivität verzweigen

Fügen Sie eine IF-Aktivität hinzu und verbinden Sie dann ihre Verzweigungen mit den Forms- und Fast-Learning-Aktivitäten, sodass jeder Dokumenttyp zum richtigen Extraktionspfad geleitet wird.
7

Testen und veröffentlichen

Klicken Sie auf Test Skill Using Selected Documents. Wenn die Ergebnisse akzeptabel sind, veröffentlichen Sie den Skill. Andernfalls passen Sie die Kennzeichnung an und trainieren Sie erneut.

Forms-Aktivität

Extrahieren Sie Felder aus Dokumenten mit festem Layout.

Extraction Rules-Aktivität

Definieren Sie eine regelbasierte Extraktion für unstrukturierte Elemente wie Barcodes.

Fast Learning-Aktivität

Verfeinern Sie die Extraktion in Dokumenten mit freiem Layout mithilfe von Feedback aus der manuellen Überprüfung.

Classify-Aktivitäten

Verzweigen Sie einen Workflow vor der Extraktion anhand der Dokumentvariante.