Skills für die Verarbeitung unstrukturierter Dokumente können nur im Advanced Designer erstellt werden; der cloudbasierte Skill Designer unterstützt diese Szenarien nicht. Dabei kommen vier zentrale NLP-Aktivitäten zum Einsatz, um Entitäten zu identifizieren, Text zu segmentieren und Felder aus Freitextinhalten wie Verträgen, Briefen und E-Mails zu extrahieren:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Segmentation-Aktivität
- Deep Learning for NLP-Aktivität
- Named Entities (NER)-Aktivität
- Address Parsing-Aktivität
Jede dieser Aktivitäten unterstützt nur eine begrenzte Anzahl von Sprachen. Die Sprachliste finden Sie auf der Referenzseite der jeweiligen Aktivität.
Wählen Sie ein Szenario
| Szenario | Wann zu verwenden | Zentrale Aktivitäten |
|---|---|---|
| Vortrainierte Named Entities (gesamtes Dokument) | Entitäten können überall vorkommen — nur minimale Konfiguration erforderlich | NER (+ Address Parsing) |
| Vortrainierte Named Entities (bestimmte Absätze) | Die Entität befindet sich immer in einem bekannten Absatz | Segmentation + NER (oder Address Parsing) |
| Benutzerdefinierte Named Entities (Deep Learning for NLP) | Vortrainierte Modelle können nicht eindeutig unterscheiden, oder Ihr Entitätstyp wird nicht abgedeckt | Segmentation + Deep Learning for NLP |
Typischer Workflow
Einen Document-Skill erstellen
Öffnen Sie Advanced Designer und klicken Sie auf der Startseite auf Create Document Skill.
Dokumente hochladen
Laden Sie auf der Registerkarte Documents die Dokumente hoch, die Sie zum Einrichten des Skills verwenden möchten.
Felder definieren und kennzeichnen
Erstellen und konfigurieren Sie auf der Registerkarte Fields die Felder, die der Skill extrahieren soll. Kennzeichnen Sie die Dokumente im Abschnitt Reference.
NLP-Aktivitäten hinzufügen und konfigurieren
Fügen Sie auf der Registerkarte Activities die Aktivitäten für Ihr Szenario hinzu (siehe unten). Öffnen Sie jede Aktivität im Activity Editor, um sie zu konfigurieren und zu trainieren.
Testen und veröffentlichen
Klicken Sie auf Test Skill Using Selected Documents, um die Ergebnisse auszuwerten. Wenn die Ergebnisse gut genug sind, veröffentlichen Sie den Skill.
Vortrainierte Named Entities (gesamtes Dokument)

Vortrainierte Named Entities (spezifische Absätze)

Benutzerdefinierte Named Entities (Deep Learning for NLP)
Das Training einer Deep Learning for NLP-Aktivität erfordert mindestens 50 Dokumente (150 empfohlen). Für optimale Ergebnisse sollten Sie auch die vortrainierte Aktivität Named Entities (NER) ausprobieren und dann die auswählen, die aus Ihren Dokumenten präziser extrahiert.

Named Entities (NER)-Aktivität
Extrahieren Sie vortrainierte Entitäten wie Namen, Organisationen und Datumsangaben aus unstrukturiertem Text.
Address Parsing-Aktivität
Teilen Sie Adressen in Straße, Stadt, Bundesstaat, Land und Postleitzahl auf.
Segmentation-Aktivität
Isolieren Sie den Absatz, der die Daten enthält, die Sie extrahieren möchten.
Deep Learning for NLP-Aktivität
Trainieren Sie ein neuronales Netzwerk, um benutzerdefinierte oder schwer zu unterscheidende Entitäten zu extrahieren.
