Zum Hauptinhalt springen
Die Aktivität „Deep Learning for NLP“ ist darauf ausgelegt, den Skill zu trainieren, um Felder aus unstrukturierten Dokumenten mit Natural Language Processing (NLP)-Technologie zu extrahieren. Die Deep-Learning-Aktivität kann nur für ein Feld eingerichtet werden, das zuvor von einer anderen Aktivität extrahiert wurde. Sie können zum Beispiel einen Textabschnitt mit einer „Segmentation“-Aktivität extrahieren und anschließend eine Deep-Learning-Aktivität einrichten, um Felder aus diesem Abschnitt zu extrahieren.
Hinweis: Diese Aktivität unterstützt nur Felder des Typs Text.

Trainingsanforderungen

Da Deep-Learning-Aktivitäten anhand von Referenzkennzeichnungen trainiert werden, ist es wichtig, dass die Position der Felder auf allen Dokumentbildern korrekt angegeben wird. Je größer die Anzahl der gekennzeichneten Dokumente im Trainingssatz ist, desto höher ist die Qualität der Feldextraktion. Die empfohlene Anzahl von Beispieldokumenten ist wie folgt:
  • Für Dokumente mit hoher Variabilität sind mindestens 150 Beispieldokumente (2–3 Beispieldokumente pro Variante) erforderlich.
  • Für Dokumente mit geringer Variabilität können wir das Training mit einem Beispieldokument beginnen, aber es sind mindestens 2–3 Beispieldokumente pro Variante erforderlich.

Verwenden separater Dokumentensätze

Sie können einen separaten Dokumentensatz zum Trainieren Ihrer Deep-Learning-Aktivität verwenden. Wählen Sie dazu in der Dropdown-Liste neben dem Namen des Skills die Deep-Learning-Aktivität aus. Wählen Sie dann in der Dropdown-Liste links neben der Schaltfläche Upload den gewünschten Dokumentensatz aus oder klicken Sie auf Create Set…, um einen neuen zu erstellen. Sie können auf dieser Registerkarte Dokumente hochladen, löschen und drehen, wie im Abschnitt Dokumente beschrieben.

Unterstützte Sprachen

Unterstützte Sprachen: Englisch, Französisch, Deutsch, Japanisch, Russisch, Spanisch, Italienisch, Portugiesisch (Standard) und Niederländisch.

Einrichten einer Deep-Learning-Aktivität

Führen Sie zum Einrichten einer Deep-Learning-Aktivität die folgenden Schritte aus:
  1. Fügen Sie auf der Registerkarte Activities eine Deep-Learning-Aktivität zum Dokumentverarbeitungsablauf hinzu. Beachten Sie, dass Ihre Deep-Learning-Aktivität hinter der Aktivität platziert werden sollte, die das Feld extrahiert, das von Ihrer Deep-Learning-Aktivität als Quelle verwendet wird.
  2. Verwenden Sie die Dropdown-Liste Field im Bereich Activity Properties, um das Quellfeld auszuwählen, das dem unstrukturierten Textabschnitt entspricht, aus dem Felder extrahiert werden sollen.
  3. Wählen Sie die Felder aus, die aus dem Quellfeld extrahiert werden sollen. Sie können Felder auswählen, die sich auf derselben Verschachtelungsebene wie das Quellfeld oder eine Ebene darunter befinden.
  4. Klicken Sie auf Activity Editor und wechseln Sie zur Registerkarte Fields, um Ihre Dokumente zu labeln, indem Sie die Bereiche für die Felder angeben, die aus dem Quellfeld extrahiert werden sollen. Der Labeling-Prozess im Activity Editor ist identisch mit dem regulären document labeling process, mit einer Ausnahme — die Felder, die von der Deep-Learning-Aktivität extrahiert werden sollen, müssen sich innerhalb des Bereichs des Quellfelds befinden.
Die folgenden Richtlinien helfen Ihnen dabei, die Größe des Dokumentensatzes festzulegen:
  • Eine Deep-Learning-Aktivität für NLP kann mit einem Beispieldokument gestartet werden, jedoch sind mindestens 2–3 Beispieldokumente pro Variante erforderlich.
  • Wenn der Trainingssatz zwischen 1 und 150 Dokumente enthält, können Sie mit dem Training Ihrer Aktivität beginnen, aber Advanced Designer zeigt eine Warnung mit dem Hinweis „Wir empfehlen, mindestens 150 Dokumente hinzuzufügen“ an.
  • Wenn der Trainingssatz zwischen 150 und 10.000 Dokumente enthält, können Sie sofort mit dem Training Ihrer Aktivität beginnen. Dies ist die empfohlene Anzahl von Dokumenten für Ihren Trainingssatz.
  • Wenn der Trainingssatz mehr als 10.000 Dokumente enthält, zeigt Advanced Designer eine Warnung an, dass die Skill möglicherweise instabil wird.
  1. Klicken Sie auf Train Activity, um die Aktivität zu trainieren.
  2. Sobald die Aktivität trainiert wurde, startet der Aktivitätstest automatisch. Nachdem der Test abgeschlossen ist, wechseln Sie zur Registerkarte Results und analysieren Sie die Ergebnisse der Feldextraktion für Ihre Aktivität. Die auf der Registerkarte Results angezeigten Statistiken sind identisch mit den allgemeinen Statistiken für die Skill, die auf der Registerkarte Results angezeigt werden. Nehmen Sie bei Bedarf die erforderlichen Änderungen an Ihrem Labeling vor und trainieren Sie die Aktivität erneut.
Die Aktivität kann nur mit Dokumenten mit bestätigtem Labeling trainiert und getestet werden. Dokumente haben ein unbestätigtes Labeling, wenn das Referenz-Labeling automatisch auf Grundlage des Vorhersage-Labelings generiert wurde, es sei denn, Sie kopieren das Vorhersage-Labeling mit der entsprechenden Option im Dokumentkontextmenü in das Referenz-Labeling. Sie können den Labeling-Status für jedes Dokument auf der Registerkarte Documents überprüfen. Um das Labeling für ein Dokument zu bestätigen, sollten Sie es auf der Registerkarte Fields prüfen.