Deep-Learning-Aktivität für NLP

Die Deep-Learning-Aktivität für NLP dient dazu, den Skill so zu trainieren, dass er mithilfe der Technologie der natürlichen Sprachverarbeitung (NLP) Felder aus unstrukturierten Dokumenten extrahiert. Die Deep-Learning-Aktivität kann nur für ein Feld eingerichtet werden, das zuvor von einer anderen Aktivität extrahiert wurde. Sie können beispielsweise mit einer Segmentation-Aktivität einen Textabsatz extrahieren und anschließend eine Deep-Learning-Aktivität einrichten, um Felder aus diesem Absatz zu extrahieren.

Diese Aktivität unterstützt nur Felder vom Typ Text.

Anforderungen an das Training

Da Deep-Learning-Aktivitäten mithilfe der Referenzkennzeichnung trainiert werden, ist es wichtig, dass die Position der Felder auf allen Dokumentbildern korrekt festgelegt wird. Je mehr annotierte Dokumente im Trainingsdatensatz enthalten sind, desto höher ist die Qualität der Feldextraktion. Die empfohlene Anzahl von Beispieldokumenten ist wie folgt:

Für Dokumente mit hoher Variabilität sind mindestens 150 Beispieldokumente erforderlich (2–3 Beispieldokumente pro Variante).
Für Dokumente mit geringer Variabilität kann das Training mit 1 Beispieldokument begonnen werden, erforderlich sind jedoch mindestens 2–3 Beispieldokumente pro Variante.

Verwenden Sie separate Dokumentensätze

Sie können einen separaten Dokumentensatz verwenden, um Ihre Deep-Learning-Aktivität zu trainieren. Wählen Sie dazu die Deep-Learning-Aktivität in der Dropdown-Liste neben dem Skill-Namen aus. Wählen Sie dann in der Dropdown-Liste links neben der Schaltfläche Hochladen den benötigten Dokumentensatz aus oder klicken Sie auf Set erstellen…, um einen neuen anzulegen. Auf diesem Tab können Sie Dokumente hochladen, löschen und drehen, wie im Abschnitt documents beschrieben.

Unterstützte Sprachen

Unterstützte Sprachen: Englisch, Französisch, Deutsch, Japanisch, Russisch, Spanisch, Italienisch, Portugiesisch (Standard) und Niederländisch.

Einrichten einer Deep-Learning-Aktivität

Aktivität hinzufügen

Fügen Sie auf der Registerkarte Aktivitäten eine Deep-Learning-Aktivität zum Dokumentenverarbeitungsfluss hinzu. Beachten Sie, dass Ihre Deep-Learning-Aktivität nach der Aktivität platziert werden sollte, die das Feld extrahiert, das von Ihrer Deep-Learning-Aktivität als Quelle verwendet wird.

Quellfeld auswählen

Verwenden Sie die Dropdown-Liste Field im Bereich Activity Properties, um das Quellfeld auszuwählen, das dem unstrukturierten Textfragment entspricht, aus dem Felder extrahiert werden sollen.

Ausgabefelder auswählen

Wählen Sie die Felder aus, die aus dem Quellfeld extrahiert werden sollen. Sie können Felder auswählen, die sich auf derselben Verschachtelungsebene wie das Quellfeld oder eine Ebene darunter befinden.

Dokumente kennzeichnen

Klicken Sie auf Activity Editor und wechseln Sie zur Registerkarte Fields, um Ihre Dokumente zu kennzeichnen, indem Sie die Regionen für die Felder angeben, die aus dem Quellfeld extrahiert werden sollen. Der Kennzeichnungsprozess im Activity Editor ist mit dem regulären Dokumentkennzeichnungsprozess identisch, mit einer Ausnahme — die Felder, die von der Deep-Learning-Aktivität extrahiert werden sollen, müssen sich innerhalb der Region des Quellfelds befinden.Verwenden Sie die folgenden Richtlinien, um die Größe des Dokumentensatzes zu bestimmen:

Eine Deep-Learning-Aktivität für NLP kann bereits mit 1 Beispieldokument gestartet werden, erforderlich sind jedoch mindestens 2–3 Beispieldokumente pro Variante.
Wenn der Trainingsdatensatz zwischen 1 und 150 Dokumenten enthält, können Sie mit dem Training Ihrer Aktivität beginnen, aber Advanced Designer zeigt eine Warnung mit dem Hinweis „Wir empfehlen, mindestens 150 Dokumente hinzuzufügen“ an.
Wenn der Trainingsdatensatz zwischen 150 und 10.000 Dokumenten enthält, können Sie sofort mit dem Training Ihrer Aktivität beginnen. Dies ist die empfohlene Anzahl an Dokumenten für Ihren Trainingsdatensatz.
Wenn der Trainingsdatensatz mehr als 10.000 Dokumente enthält, zeigt Advanced Designer eine Warnung an, dass der Skill instabil werden kann.

Aktivität trainieren

Klicken Sie auf Train Activity, um die Aktivität zu trainieren.

Ergebnisse überprüfen

Sobald die Aktivität trainiert wurde, beginnt der Test der Aktivität automatisch. Nachdem der Test abgeschlossen ist, wechseln Sie zur Registerkarte Results und analysieren Sie die Ergebnisse der Feldextraktion für Ihre Aktivität. Die auf der Registerkarte Results angezeigten Statistiken sind mit den allgemeinen Statistiken für den Skill identisch, die auf der Registerkarte Results angezeigt werden. Nehmen Sie bei Bedarf die erforderlichen Änderungen an Ihrer Kennzeichnung vor und trainieren Sie die Aktivität erneut.

Die Aktivität kann nur mit Dokumenten mit bestätigter Kennzeichnung trainiert und getestet werden. Dokumente haben eine unbestätigte Kennzeichnung, wenn die Referenzkennzeichnung automatisch auf Grundlage der vorhergesagten Kennzeichnung erstellt wurde, es sei denn, Sie kopieren die vorhergesagte Kennzeichnung mithilfe der entsprechenden Option im Dokument-Kontextmenü in die Referenzkennzeichnung. Sie können den Kennzeichnungsstatus für jedes Dokument auf der Registerkarte documents überprüfen. Um die Kennzeichnung für ein Dokument zu bestätigen, sollten Sie sie auf der Registerkarte Fields überprüfen.

​Anforderungen an das Training

​Verwenden Sie separate Dokumentensätze

​Unterstützte Sprachen

​Einrichten einer Deep-Learning-Aktivität

Anforderungen an das Training

Verwenden Sie separate Dokumentensätze

Unterstützte Sprachen

Einrichten einer Deep-Learning-Aktivität