Zum Hauptinhalt springen
Sie können einen separaten Dokumentensatz verwenden, um Ihre Segmentierungsaktivität zu trainieren. Wählen Sie dazu in der Dropdown-Liste neben dem Skill-Namen die Segmentierungsaktivität aus. Wählen Sie anschließend in der Dropdown-Liste links neben der Schaltfläche Upload den gewünschten Dokumentensatz aus oder klicken Sie auf Create Set…, um einen neuen zu erstellen. Auf dieser Registerkarte können Sie Dokumente hochladen, löschen und drehen, wie im Abschnitt Documents beschrieben. So richten Sie eine Segmentierungsaktivität ein:
  1. Fügen Sie auf der Registerkarte Activities eine Segmentierungsaktivität zum Dokumentverarbeitungsfluss hinzu. Beachten Sie, dass Ihre Segmentierungsaktivität der Aktivität vorausgehen sollte, die die Felder aus den Textsegmenten extrahiert.
  2. Wählen Sie im Bereich Activity Properties alle Felder aus, die den zu extrahierenden Segmenten entsprechen.
Hinweis: Es werden nur Felder des Typs Text unterstützt, deren Datentyp auf Text gesetzt ist.
  1. Klicken Sie auf Activity Editor. Nehmen Sie bei Bedarf weitere Änderungen an der Dokumentkennzeichnung auf der Registerkarte Fields vor.
  2. Klicken Sie auf Train Activity. Das Training kann im Modus Fast oder Thorough durchgeführt werden.
    • Der Modus Fast ist standardmäßig ausgewählt. Dieser Modus funktioniert auch mit kleinen Dokumentensätzen, und die Aktivität wird schnell trainiert.
    • Wenn Sie mit den Ergebnissen im Modus Fast nicht zufrieden sind, wechseln Sie zum Modus Thorough, der ein Deep-Learning-Modell trainiert. Dieser Modus erfordert mehr Dokumente im Trainingssatz und benötigt mehr Zeit, kann jedoch bei einer Vielzahl von Dokumenten bessere Ergebnisse liefern. Der Dokumentensatz muss mindestens 50 gekennzeichnete Dokumente enthalten; empfohlen sind mindestens 150 gekennzeichnete Dokumente. Um in den Modus Thorough zu wechseln, verwenden Sie das Dropdown-Menü neben der Schaltfläche Train Activity.
    • Testen Sie ggf. beide Modi und wählen Sie den, der für Ihre Dokumente am besten geeignet ist.
Hinweis: Der Modus Thorough funktioniert nur mit englischsprachigen Dokumenten.
  1. Sobald die Aktivität trainiert wurde, startet das Testen der Aktivität automatisch. Nach Abschluss des Tests wechseln Sie zur Registerkarte Results und analysieren die Felderkennungs-Ergebnisse für Ihre Aktivität. Die auf der Registerkarte Results angezeigten Statistiken sind identisch mit den allgemeinen Statistiken für den Skill, die auf der Registerkarte Results angezeigt werden. Nehmen Sie bei Bedarf Änderungen an Ihrer Kennzeichnung vor und trainieren Sie die Aktivität erneut.
Hinweis: Die Aktivität kann nur mit Dokumenten mit bestätigter Kennzeichnung trainiert und getestet werden. Dokumente weisen eine unbestätigte Kennzeichnung auf, wenn die Referenzkennzeichnung automatisch auf Basis der vorhergesagten Kennzeichnung generiert wurde, es sei denn, Sie kopieren die vorhergesagte Kennzeichnung mithilfe der entsprechenden Option im Dokumentkontextmenü in die Referenz. Den Kennzeichnungsstatus für jedes Dokument können Sie auf der Registerkarte Documents überprüfen. Um die Kennzeichnung für ein Dokument zu bestätigen, überprüfen Sie es auf der Registerkarte Fields.
Unterstützte Sprachen: Englisch, Russisch, Deutsch, Französisch, Spanisch, Italienisch, Portugiesisch (Standard), Japanisch und Niederländisch.