Ein Document-Skill extrahiert Feldwerte aus einem Dokumenttyp. Sie können Document-Skills entweder in ABBYY Vantage (Cloud) oder in Advanced Designer (Windows-Desktopanwendung) erstellen. Verwenden Sie Advanced Designer, wenn Sie mehrere Vantage-Technologien kombinieren, NLP hinzufügen oder den Verarbeitungsablauf je nach Dokumenttyp verzweigen müssen — typische Szenarien finden Sie unter Anwendungsfälle. Hintergrundinformationen zu Dokumentkategorien finden Sie unter Daten aus Dokumenten in Advanced Designer extrahieren.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Varianten von Dokumenttypen
| Varianten | Am besten geeignet |
|---|---|
| Bis zu ~10 (feste Formulare) | Forms activity — siehe Strukturierte Dokumente in Advanced Designer verarbeiten. |
| Die meisten wesentlichen Varianten | Fast Learning und/oder die Aktivität Extraction Rules. |
| Hunderte | Online Learning in Vantage verfeinert den Skill anhand des Feedbacks aus der manuellen Prüfung. |
| Tausende | Deep Learning activity extrahiert mit einer Genauigkeit von ~80–90 %, abhängig von der Komplexität des Dokuments. |
Wenn ein festes Formular deutlich mehr als ~10 Varianten hat, behandeln Sie jede Variante als separaten Dokumenttyp.
Training und Testen eines Document-Skills
- Trainingsdatensatz — dient zum Trainieren des Skills.
- Testdatensatz — dient dazu, die Genauigkeit während der Entwicklung zu messen.
- Blinddatensatz — ein zusätzlicher Testdatensatz, den der Skill noch nie gesehen hat und der zur Bewertung der tatsächlichen Generalisierungsfähigkeit dient.
Verwenden Sie für jeden Datensatz unterschiedliche Dokumente. Die Wiederverwendung von Trainingsdokumenten im Testdatensatz führt zu zu hohen Genauigkeitsschätzungen.
Trainingsdatensatz
| Aktivität | Dokumente mit hoher Variabilität | Dokumente mit geringer Variabilität |
|---|---|---|
| Deep Learning für semi-strukturierte Dokumente | Mindestens 200–300 (2–3 pro Variante) | Mindestens 10 (2–3 pro Variante) |
| Segmentierung | Mindestens 100 | Mindestens 20 |
| Deep Learning für NLP | Mindestens 150 (2–3 pro Variante) | Sie können mit 1 beginnen; angestrebt sind 2–3 pro Variante |
Auch wenn Sie die empfohlene Anzahl nicht erreichen, ist ein Dokument pro Variante besser als keines.
Testdatensatz
Blinddatensatz
Konfigurieren eines Document-Skills
Skill-Einstellungen
Klicken Sie auf die Schaltfläche „Einstellungen” neben dem Skill-Namen, um die Skill-Einstellungen anzuzeigen und anzupassen.
Dokumente hochladen
Laden Sie auf der Registerkarte Documents die Dokumente hoch, mit denen der Skill arbeiten soll.
Felder definieren
Erstellen Sie auf der Registerkarte Fields die Felder, die Sie extrahieren möchten, und markieren Sie deren Positionen in Beispieldokumenten.
Aktivitäten konfigurieren
Erstellen Sie auf der Registerkarte Activities den Dokumentverarbeitungsablauf.
Skill testen
Testen Sie auf der Registerkarte Results den Skill anhand von Beispieldokumenten und überprüfen Sie die Extraktionsqualität.
Publish
Veröffentlichen Sie auf der Registerkarte Publish den Skill, um ihn im Skill Catalog in ABBYY Vantage verfügbar zu machen.
Nächste Schritte
Skill-Einstellungen
Konfigurieren Sie Optionen für Erkennung, Training und Verarbeitung.
Aktivitäten
Wählen und kombinieren Sie Aktivitäten für den Verarbeitungsablauf.
Derived Skills
Erstellen Sie einen neuen Skill auf Basis eines integrierten oder schreibgeschützten Vantage-Skills.
Anwendungsfälle
Sehen Sie sich ausgearbeitete Szenarien für gängige Dokumenttypen an.
