- Bewegen Sie den Mauszeiger über ein Wort und klicken Sie darauf. Dadurch wird ein Bereich erstellt und das Wort in das Feld übernommen. Verwenden Sie diese Methode für Felder, die nur aus einem Wort bestehen.
- Zeichnen Sie ein Rechteck um mehrere Wörter. Alle Wörter innerhalb dieses Rechtecks werden in das Feld übernommen. Wir empfehlen diese Methode für halbstrukturierte Dokumente.
- Wählen Sie einen Bereich aus, indem Sie auf das erste Wort der Sequenz klicken und bei gedrückter linker Maustaste den Cursor bis zum letzten Wort der Sequenz ziehen. Wir empfehlen diese Methode für unstrukturierte Dokumente.
Strukturierte Dokumente
- Geben Sie den Bereich jedes Felds präzise an, da reine Feldwerte für das Training nicht ausreichen.
- Klicken Sie zum Markieren des Bereichs eines Felds nicht auf dessen Wert, sondern markieren Sie den gesamten Platzhalter.
- Wenn ein Feld keinen Wert enthält, markieren Sie den leeren Platzhalter.
- Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Taste Umschalt gedrückt, um die Teile hinzuzufügen. Bitte beachten Sie, dass alle Teile auf derselben Seite liegen müssen.
- Wenn ein festes Formular eine Tabelle enthält, markieren Sie alle Zeilen, einschließlich der leeren.
- Wenn nach bereits durchgeführter Kennzeichnung ein Feld hinzugefügt wird, muss dieses neue Feld in allen Dokumenten des Trainingssatzes gekennzeichnet werden. Bitte überprüfen Sie alle Ihre Dokumente und kennzeichnen Sie das neue Feld in allen Dokumenten, in denen es vorkommt.
Halbstrukturierte Dokumente
- Achten Sie darauf, den Bereich jedes Felds genau anzugeben, da Feldwerte allein für das Training nicht ausreichen.
- Um den Bereich eines Felds zu markieren, klicken Sie auf seinen Wert (z. B. auf das Wort oder die Wörter, die es enthält); der Bereich wird automatisch erstellt.
- Wenn ein Feld keinen Wert enthält, erstellen Sie keinen Bereich für dieses Feld.
- Markieren Sie keine Wortteile, da das Programm nur mit ganzen Wörtern lernen kann.
- Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Taste Umschalt gedrückt, um die Teile hinzuzufügen. Bitte beachten Sie, dass sich alle Teile auf derselben Seite befinden sollten.
- Wenn Sie eine sich wiederholende Struktur haben, analysieren Sie zunächst Ihre Dokumente und erstellen Sie entweder eine Tabelle oder eine wiederholbare Gruppe. Wenn Ihre Dokumente Tabellen mit einer gemeinsamen Kopfzeile und Werten enthalten, neben denen keine Schlüsselwörter stehen, erstellen Sie eine Tabelle. Wenn Ihre Daten weniger strukturiert sind und Schlüsselwörter neben den Werten stehen, erstellen Sie eine Gruppe mit der Option Mehrere Elemente zulassen. Wenn die Daten in verschiedenen Dokumenten unterschiedlich organisiert sind, wählen Sie die Option, die für die Mehrheit der Dokumente am besten passt.
- Beim Labeln einer Tabelle markieren Sie die erste Zeile und klicken Sie dann auf Tabelle ab dieser Zeile fortsetzen, und vergewissern Sie sich, dass die gesamte Tabelle korrekt gelabelt wurde. Um die Zellen in der ersten Zeile zu markieren, klicken Sie nacheinander auf diese Zellen; die entsprechenden Spalten werden automatisch erstellt. Fahren Sie fort, bis die gesamte Tabelle markiert wurde.
- Weisen Sie das Programm nicht an, Felder innerhalb des Bereichs eines anderen Felds zu finden, unabhängig davon, ob es sich um ein einzelnes Feld (z. B. eine Adresse) oder eine Tabellenzelle (z. B. „Description“) handelt. Wenn Sie Daten aus einem großen Textfragment extrahieren müssen, verwenden Sie eine Abfolge von Aktivitäten. Verwenden Sie zunächst eine Aktivität, die für die Extraktion von Daten aus halbstrukturierten Dokumenten vorgesehen ist, und trainieren Sie sie darauf, den gewünschten Bereich zu finden. Verwenden Sie anschließend, um spezifische Felder aus diesem Bereich zu extrahieren, eine Aktivität, die für die Extraktion von Daten aus Text (NLP) vorgesehen ist, oder implementieren Sie eigene Skriptregeln.
- Wenn ein Feld hinzugefügt wird, nachdem bereits Labeling durchgeführt wurde, muss dieses neue Feld in allen Dokumenten des Trainingssatzes gelabelt werden. Bitte überprüfen Sie alle Ihre Dokumente und labeln Sie das neue Feld in allen Dokumenten, in denen es vorkommt.
Unstrukturierte Dokumente
- Achten Sie darauf, die Region jedes Felds präzise festzulegen, da Feldwerte allein für das Training nicht ausreichen.
- Beim Labeln von Segmenten (z. B. Felder, die in der Aktivität „Segmentation“ trainiert werden) sollten die Regionen einen oder mehrere ganze Absätze umfassen. Ein Segment darf nicht nur einen Teil eines Absatzes enthalten.
- Um die Region eines Felds zu markieren, klicken Sie auf dessen Wert (z. B. das Wort oder die Wörter, die es enthält); die Region wird automatisch erstellt.
- Wenn ein Feld keinen Wert enthält, erstellen Sie keine Region für dieses Feld.
- Markieren Sie keine Wortteile, da das Programm nur mit ganzen Wörtern lernen kann.
- Mitunter kann eine Feldregion auf die nächste Seite überlaufen (zum Beispiel eine Klausel in einem Vertrag). Markieren Sie in diesem Fall einen Teil des Felds auf der ersten Seite und setzen Sie das Labeln auf der nächsten Seite fort, während Sie die Taste Umschalt gedrückt halten.
- Wenn Sie eine Region für ein Feld innerhalb der Region eines anderen Felds erstellen (zum Beispiel um ein Feld innerhalb eines Segments zu markieren), wählen Sie das gewünschte Feld aus und beginnen Sie einfach mit dem Labeln innerhalb der Region des anderen Felds. Dadurch wird die vorhandene Region nicht ausgewählt, sondern eine neue Region für das ausgewählte Feld erstellt.
