- Fügen Sie auf der Registerkarte Activities dem Dokumentverarbeitungsfluss eine Segmentierungsaktivität hinzu. Beachten Sie, dass Ihre Segmentierungsaktivität vor der Aktivität liegen sollte, die die Felder aus den Textsegmenten extrahiert.
- Wählen Sie im Bereich Activity Properties alle Felder aus, die den zu extrahierenden Segmenten entsprechen.
Hinweis: Unterstützt werden nur Felder des Typs Text, deren Datentyp auf Text gesetzt ist.
- Klicken Sie auf Activity Editor. Nehmen Sie bei Bedarf auf der Registerkarte Fields weitere Anpassungen an der Dokumentkennzeichnung vor.
- Klicken Sie auf Train Activity. Das Training kann im Modus Fast oder Thorough durchgeführt werden.
- Der Modus Fast ist standardmäßig ausgewählt. Er funktioniert auch bei kleinen Dokumentensätzen und trainiert die Aktivität schnell.
- Wenn Sie mit den Ergebnissen im Modus Fast nicht zufrieden sind, wechseln Sie in den Modus Thorough, der ein Deep-Learning-Modell trainiert. Dieser Modus erfordert mehr Dokumente im Trainingssatz und dauert länger, kann aber bei einer Vielzahl von Dokumenten bessere Ergebnisse liefern. Der Dokumentensatz muss mindestens 50 gekennzeichnete Dokumente enthalten; empfohlen werden mindestens 150. Um in den Modus Thorough zu wechseln, verwenden Sie das Dropdown-Menü neben der Schaltfläche Train Activity.
- Testen Sie ggf. beide Modi und wählen Sie denjenigen aus, der für Ihre Dokumente am besten geeignet ist.
Hinweis: Der Modus Thorough funktioniert nur mit englischsprachigen Dokumenten.
- Nach dem Training startet das Testen der Aktivität automatisch. Nach Abschluss des Tests wechseln Sie zur Registerkarte Results und analysieren die Felderkennungsergebnisse für Ihre Aktivität. Die auf der Registerkarte Results angezeigten Statistiken entsprechen den allgemeinen Statistiken für den Skill auf der Registerkarte Results. Nehmen Sie bei Bedarf Anpassungen an Ihrer Kennzeichnung vor und trainieren Sie die Aktivität erneut.
Hinweis: Die Aktivität kann nur mit Dokumenten mit bestätigter Kennzeichnung trainiert und getestet werden. Dokumente haben eine unbestätigte Kennzeichnung, wenn die Referenzkennzeichnung automatisch auf Grundlage der vorhergesagten Kennzeichnung generiert wurde – es sei denn, Sie kopieren die vorhergesagte Kennzeichnung mithilfe der entsprechenden Option im Dokumentkontextmenü in die Referenz. Den Kennzeichnungsstatus für jedes Dokument können Sie auf der Registerkarte Documents prüfen. Um die Kennzeichnung für ein Dokument zu bestätigen, überprüfen Sie es auf der Registerkarte Fields.Unterstützte Sprachen: Englisch, Russisch, Deutsch, Französisch, Spanisch, Italienisch, Portugiesisch (Standard), Japanisch und Niederländisch.
