- Bewegen Sie den Mauszeiger über ein Wort und klicken Sie darauf. Dadurch wird ein Bereich erstellt und das Wort in das Feld kopiert. Verwenden Sie diese Methode, um Felder zu beschriften, die nur aus einem Wort bestehen.
- Zeichnen Sie ein Rechteck um mehrere Wörter. Alle Wörter innerhalb dieses Rechtecks werden in das Feld kopiert. Wir empfehlen, diese Methode zur Beschriftung halbstrukturierter Dokumente zu verwenden.
- Wählen Sie einen Bereich aus, indem Sie auf das erste Wort der Sequenz klicken und bei gedrückter linker Maustaste den Cursor bis zum letzten Wort der Sequenz ziehen. Wir empfehlen, diese Methode zur Beschriftung unstrukturierter Dokumente zu verwenden.
Strukturierte Dokumente
- Achten Sie darauf, den Bereich jedes Felds präzise festzulegen, da Feldwerte allein für das Training nicht ausreichen.
- Um den Bereich eines Felds zu markieren, klicken Sie nicht auf seinen Wert, sondern markieren Sie den gesamten Platzhalter.
- Wenn ein Feld keinen Wert enthält, markieren Sie den leeren Platzhalter.
- Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Taste Umschalt gedrückt, um die Teile hinzuzufügen. Beachten Sie, dass alle Teile auf derselben Seite liegen sollten.
- Wenn ein festes Formular eine Tabelle enthält, markieren Sie alle Zeilen, einschließlich der leeren.
- Wenn nach bereits erfolgter Kennzeichnung ein Feld hinzugefügt wird, muss dieses neue Feld in allen Dokumenten des Trainingssatzes gekennzeichnet werden. Überprüfen Sie alle Ihre Dokumente und kennzeichnen Sie das neue Feld in allen Dokumenten, in denen es vorkommt.
Halbstrukturierte Dokumente
- Geben Sie den Bereich jedes Felds genau an, da Feldwerte allein für das Training nicht ausreichen.
- Um den Bereich eines Felds zu markieren, klicken Sie auf dessen Wert (z. B. auf das enthaltene Wort oder die enthaltenen Wörter). Der Bereich wird automatisch erstellt.
- Wenn ein Feld keinen Wert enthält, erstellen Sie dafür keinen Bereich.
- Markieren Sie keine Wortteile, da das Programm nur mit ganzen Wörtern lernen kann.
- Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Taste Umschalt gedrückt, um die Teile hinzuzufügen. Beachten Sie, dass alle Teile auf derselben Seite sein müssen.
- Wenn Sie eine wiederholende Struktur haben, analysieren Sie Ihre Dokumente zuerst und erstellen Sie entweder eine Tabelle oder eine wiederholbare Gruppe. Wenn Ihre Dokumente Tabellen mit einer gemeinsamen Kopfzeile enthalten und neben den Werten keine Schlüsselwörter stehen, erstellen Sie eine Tabelle. Wenn Ihre Daten weniger strukturiert sind und sich neben den Werten Schlüsselwörter befinden, erstellen Sie eine Gruppe mit der Option Mehrere Elemente zulassen. Wenn Daten in verschiedenen Dokumenten unterschiedlich organisiert sind, wählen Sie die Option, die für die Mehrheit der Dokumente am besten geeignet ist.
- Beim Labeln einer Tabelle markieren Sie die erste Zeile und klicken dann auf Tabelle ab dieser Zeile fortsetzen, und stellen Sie sicher, dass die gesamte Tabelle korrekt gelabelt wurde. Um die Zellen der ersten Zeile zu markieren, klicken Sie nacheinander auf die Zellen. Die entsprechenden Spalten werden automatisch erstellt. Fahren Sie fort, bis die gesamte Tabelle markiert ist.
- Weisen Sie das Programm nicht an, Felder innerhalb des Bereichs eines anderen Felds zu suchen, unabhängig davon, ob es sich um ein einzelnes Feld (z. B. eine Adresse) oder eine Tabellenzelle (z. B. „Beschreibung“) handelt. Wenn Sie Daten aus einem großen Textfragment extrahieren müssen, verwenden Sie eine Abfolge von Aktivitäten. Verwenden Sie zunächst eine Aktivität, die für das Extrahieren von Daten aus halbstrukturierten Dokumenten vorgesehen ist, und trainieren Sie sie darauf, den gewünschten Bereich zu finden. Um anschließend spezifische Felder aus diesem Bereich zu extrahieren, verwenden Sie eine Aktivität für die Extraktion aus Text (NLP) oder implementieren Sie eigene Skriptregeln.
- Wenn nach bereits durchgeführtem Labeln ein Feld hinzugefügt wird, muss dieses neue Feld in allen Dokumenten im Trainingssatz gelabelt werden. Überprüfen Sie alle Ihre Dokumente und labeln Sie das neue Feld in allen Dokumenten, in denen es vorkommt.
Unstrukturierte Dokumente
- Geben Sie den Bereich jedes Felds exakt an, da Feldwerte allein für das Training nicht ausreichen.
- Beim Labeln von Segmenten (z. B. Felder, die in der Aktivität Segmentation trainiert werden), sollten Bereiche einen oder mehrere ganze Absätze umfassen. Ein Segment darf nicht nur einen Teil eines Absatzes enthalten.
- Um den Bereich eines Felds zu markieren, klicken Sie auf dessen Wert (z. B. das enthaltene Wort oder die Wörter); der Bereich wird dann automatisch erstellt.
- Wenn ein Feld keinen Wert enthält, erstellen Sie keinen Bereich für dieses Feld.
- Markieren Sie keine Wortteile, da das Programm nur mit ganzen Wörtern lernen kann.
- Manchmal kann ein Feldbereich auf die nächste Seite überlaufen (zum Beispiel eine Klausel in einem Vertrag). Markieren Sie in diesem Fall einen Teil des Felds auf der ersten Seite und setzen Sie das Labeln auf der nächsten Seite fort, während Sie die Taste Umschalt gedrückt halten.
- Wenn Sie einen Bereich für ein Feld innerhalb des Bereichs eines anderen Felds erstellen (zum Beispiel um ein Feld innerhalb eines Segments zu markieren), wählen Sie das gewünschte Feld aus und beginnen Sie einfach mit dem Labeln innerhalb des anderen Bereichs. Dadurch wird der vorhandene Bereich nicht ausgewählt, sondern ein neuer Bereich für das ausgewählte Feld erstellt.
