Ein “gemischter” Dokumentensatz kann in Advanced Designer zwei Bedeutungen haben:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Ein einzelner Satz, der sowohl semi-strukturierte als auch unstrukturierte Dokumente enthält (verschiedene Dokumenttypen).
- Ein einzelnes Dokument mit gemischter Struktur — zum Beispiel ein unstrukturierter Vertrag mit eingebetteten Tabellen, Titeln, Kopf- oder Fußzeilen.
Wählen Sie ein Szenario aus
| Szenario | Wann verwenden | Wichtige Aktivitäten |
|---|---|---|
| Semi-strukturierte und unstrukturierte Dokumente in einem Set | Beide gehören zu einem logischen Typ mit gemeinsamen Ausgabefeldern | Classify + IF + Fast Learning + Segmentation + Deep Learning for NLP |
| Tabellenzellen mit eingebetteten Feldern | Werte aus Tabellenzellen extrahieren (z. B. Namen in einer Closing Disclosure) | Fast Learning + NER (+ Address Parsing) |
| Unstrukturierte Dokumente mit eingebetteten Tabellen/Titeln/Kopf-/Fußzeilen | Überwiegend unstrukturierte Dokumente mit semi-strukturierten Fragmenten | Segmentation + Extraction Rules |
Typischer Workflow
Document-Skill erstellen
Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Document Skill.
Dokumente hochladen
Laden Sie auf der Registerkarte Documents die Dokumente hoch, die Sie zum Einrichten des Skills verwenden möchten.
Felder definieren und labeln
Erstellen und konfigurieren Sie auf der Registerkarte Fields die Felder, die der Skill extrahieren soll. Labeln Sie die Dokumente im Abschnitt Reference.
Aktivitäten hinzufügen und konfigurieren
Fügen Sie auf der Registerkarte Activities die Aktivitäten für Ihr Szenario hinzu (wie unten beschrieben). Öffnen Sie jede Aktivität im Activity Editor, um sie zu konfigurieren und zu trainieren.
Testen und veröffentlichen
Klicken Sie auf Test Skill Using Selected Documents, um die Ergebnisse auszuwerten. Wenn die Ergebnisse gut genug sind, veröffentlichen Sie den Skill.
Semi-strukturierte und unstrukturierte Dokumente in einem Set
- Verarbeiten Sie semi-strukturierte Dokumente mit einer Fast Learning-Aktivität.
- Verarbeiten Sie unstrukturierte Dokumente mit einer Segmentation-Aktivität, gefolgt von einer Deep Learning for NLP-Aktivität.

Tabellenzellen mit im Zelltext eingebetteten Feldern
- Named Entities (NER)-Aktivität für Entitäten wie Namen und Organisationen.
- Address Parsing activity, um Adressen in ihre Bestandteile zu zerlegen.


Classify By Text and Image
Klassifizieren Sie Dokumente durch die Kombination von Text- und visuellen Merkmalen.
Fast Learning-Aktivität
Extrahieren Sie Felder aus semi-strukturierten Dokumenten und Tabellenzellen.
Segmentation-Aktivität
Isolieren Sie Absätze mit unstrukturierten Feldern.
Deep Learning for NLP-Aktivität
Extrahieren Sie benutzerdefinierte oder schwer unterscheidbare Entitäten aus unstrukturiertem Text.
Named Entities (NER)-Aktivität
Extrahieren Sie vorab trainierte Entitäten wie Namen, Organisationen und Datumsangaben.
Extraction Rules-Aktivität
Definieren Sie eine regelbasierte Extraktion für semi-strukturierte Fragmente.
