Die Deep-Learning-Aktivität für NLP dient dazu, den Skill so zu trainieren, dass er mithilfe der Technologie der natürlichen Sprachverarbeitung (NLP) Felder aus unstrukturierten Dokumenten extrahiert. Die Deep-Learning-Aktivität kann nur für ein Feld eingerichtet werden, das zuvor von einer anderen Aktivität extrahiert wurde. Sie können beispielsweise mit einer Segmentation-Aktivität einen Textabsatz extrahieren und anschließend eine Deep-Learning-Aktivität einrichten, um Felder aus diesem Absatz zu extrahieren.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Anforderungen an das Training
- Für Dokumente mit hoher Variabilität sind mindestens 150 Beispieldokumente erforderlich (2–3 Beispieldokumente pro Variante).
- Für Dokumente mit geringer Variabilität kann das Training mit 1 Beispieldokument begonnen werden, erforderlich sind jedoch mindestens 2–3 Beispieldokumente pro Variante.
Verwenden Sie separate Dokumentensätze
Unterstützte Sprachen
Einrichten einer Deep-Learning-Aktivität
Aktivität hinzufügen
Fügen Sie auf der Registerkarte Aktivitäten eine Deep-Learning-Aktivität zum Dokumentenverarbeitungsfluss hinzu. Beachten Sie, dass Ihre Deep-Learning-Aktivität nach der Aktivität platziert werden sollte, die das Feld extrahiert, das von Ihrer Deep-Learning-Aktivität als Quelle verwendet wird.
Quellfeld auswählen
Verwenden Sie die Dropdown-Liste Field im Bereich Activity Properties, um das Quellfeld auszuwählen, das dem unstrukturierten Textfragment entspricht, aus dem Felder extrahiert werden sollen.
Ausgabefelder auswählen
Wählen Sie die Felder aus, die aus dem Quellfeld extrahiert werden sollen. Sie können Felder auswählen, die sich auf derselben Verschachtelungsebene wie das Quellfeld oder eine Ebene darunter befinden.
Dokumente kennzeichnen
Klicken Sie auf Activity Editor und wechseln Sie zur Registerkarte Fields, um Ihre Dokumente zu kennzeichnen, indem Sie die Regionen für die Felder angeben, die aus dem Quellfeld extrahiert werden sollen. Der Kennzeichnungsprozess im Activity Editor ist mit dem regulären Dokumentkennzeichnungsprozess identisch, mit einer Ausnahme — die Felder, die von der Deep-Learning-Aktivität extrahiert werden sollen, müssen sich innerhalb der Region des Quellfelds befinden.Verwenden Sie die folgenden Richtlinien, um die Größe des Dokumentensatzes zu bestimmen:
- Eine Deep-Learning-Aktivität für NLP kann bereits mit 1 Beispieldokument gestartet werden, erforderlich sind jedoch mindestens 2–3 Beispieldokumente pro Variante.
- Wenn der Trainingsdatensatz zwischen 1 und 150 Dokumenten enthält, können Sie mit dem Training Ihrer Aktivität beginnen, aber Advanced Designer zeigt eine Warnung mit dem Hinweis „Wir empfehlen, mindestens 150 Dokumente hinzuzufügen“ an.
- Wenn der Trainingsdatensatz zwischen 150 und 10.000 Dokumenten enthält, können Sie sofort mit dem Training Ihrer Aktivität beginnen. Dies ist die empfohlene Anzahl an Dokumenten für Ihren Trainingsdatensatz.
- Wenn der Trainingsdatensatz mehr als 10.000 Dokumente enthält, zeigt Advanced Designer eine Warnung an, dass der Skill instabil werden kann.
Ergebnisse überprüfen
Sobald die Aktivität trainiert wurde, beginnt der Test der Aktivität automatisch. Nachdem der Test abgeschlossen ist, wechseln Sie zur Registerkarte Results und analysieren Sie die Ergebnisse der Feldextraktion für Ihre Aktivität. Die auf der Registerkarte Results angezeigten Statistiken sind mit den allgemeinen Statistiken für den Skill identisch, die auf der Registerkarte Results angezeigt werden. Nehmen Sie bei Bedarf die erforderlichen Änderungen an Ihrer Kennzeichnung vor und trainieren Sie die Aktivität erneut.
