Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Kennzeichnen Sie einen repräsentativen Satz von Dokumenten, um ein Document-Skill zu trainieren und zu testen. Die folgenden Richtlinien behandeln strukturierte und halbstrukturierte Dokumente.
Informationen zu unstrukturierten Dokumenten finden Sie unter Unstrukturierte Dokumente kennzeichnen.

Strukturierte Dokumente

Strukturierte Dokumente enthalten stets exakt denselben Informationstyp an genau denselben Positionen. Ein Beispiel für strukturierte Dokumente sind vorformatierte Formulare. Sie müssen nur wenige Beispieldokumente für das Training kennzeichnen, weil das Layout nicht variiert. Beachten Sie beim Kennzeichnen strukturierter Dokumente die folgenden Richtlinien:
  • Achten Sie darauf, die Region jedes Felds genau anzugeben — Feldwerte allein reichen für das Training nicht aus.
  • Um die Region eines Felds zu markieren, klicken Sie nicht auf seinen Wert; markieren Sie stattdessen den gesamten Platzhalter.
  • Wenn ein Feld keinen Wert enthält, markieren Sie den leeren Platzhalter.
  • Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Umschalttaste gedrückt, um die Teile hinzuzufügen. Alle Teile müssen sich auf derselben Seite befinden.
  • Wenn ein festes Formular eine Tabelle enthält, markieren Sie alle Zeilen, einschließlich der leeren.
  • Wenn Sie ein Feld hinzufügen, nachdem die Kennzeichnung bereits begonnen hat, kennzeichnen Sie das neue Feld in jedem Dokument des Trainingsdatensatzes, in dem es vorkommt.

Halbstrukturierte Dokumente

Halbstrukturierte Dokumente enthalten im Allgemeinen dieselben oder ähnliche Arten von Informationen, aber Position, Größe und Anzahl der Felder können von Dokument zu Dokument variieren. Beispiele sind Abrechnungen, Zahlungsaufträge und Rechnungen. Beachten Sie beim Kennzeichnen halbstrukturierter Dokumente die folgenden Richtlinien:
  • Geben Sie die Region jedes Felds präzise an — Feldwerte allein reichen für das Training nicht aus.
  • Um die Region eines Felds zu markieren, klicken Sie auf seinen Wert — also auf das Wort oder die Wörter, die er enthält — und die Region wird automatisch erstellt.
  • Wenn ein Feld keinen Wert enthält, erstellen Sie keine Region dafür.
  • Markieren Sie keine Wortteile — Vantage kann nur mit ganzen Wörtern lernen.
  • Wenn ein Feld aus mehreren Teilen besteht, halten Sie die Umschalttaste gedrückt, um die Teile hinzuzufügen. Alle Teile müssen sich auf derselben Seite befinden.
  • Analysieren Sie bei sich wiederholenden Daten zunächst Ihre Dokumente und wählen Sie die richtige Struktur:
    Wenn Ihre sich wiederholenden Daten so aussehen…Verwenden Sie
    Eine Tabelle mit einer gemeinsamen Kopfzeile und Werten ohne benachbarte SchlüsselwörterEin Feld vom Typ Tabelle
    Weniger strukturierte Daten, bei denen neben den Werten Schlüsselwörter stehenEine Gruppe mit aktivierter Option Mehrere Elemente zulassen
    Unterschiedliche Layouts in verschiedenen DokumentenWählen Sie die Option, die für die meisten Ihrer Dokumente passt
  • Um eine Tabelle zu kennzeichnen, markieren Sie die Zellen in der ersten Zeile nacheinander — Vantage erstellt die Spalten automatisch. Klicken Sie dann auf Tabelle ab dieser Zeile fortsetzen, und prüfen Sie, ob die gesamte Tabelle korrekt gekennzeichnet ist.
  • Platzieren Sie keine Feldregion innerhalb der Region eines anderen Felds — unabhängig davon, ob das übergeordnete Element ein einzelnes Feld (z. B. eine Adresse) oder eine Tabellenzelle ist. Verwenden Sie Advanced Designer, um Daten aus einem größeren Textfragment zu extrahieren.
  • Wenn Sie ein Feld hinzufügen, nachdem die Kennzeichnung bereits begonnen hat, prüfen Sie alle Dokumente und kennzeichnen Sie das neue Feld in jedem Dokument, in dem es vorkommt.
Wenn Tabellen groß sind und Dokumentseiten ähnlich aussehen, können Sie die ähnlichen Seiten löschen und nur die erste Seite, die letzte Seite und einige Seiten dazwischen kennzeichnen.

Felder hinzufügen

Markieren Sie Felder auf der Registerkarte Editor und konfigurieren Sie die Feldeigenschaften entsprechend dem Typ.

Unstrukturierte Dokumente kennzeichnen

Advanced Designer-Leitfaden zum Kennzeichnen unstrukturierter Dokumente.

Einen Document-Skill einrichten

Erstellen, trainieren und veröffentlichen Sie einen Document-Skill, einschließlich strukturierter Formulare und Online Learning.

Training und Testen eines Document-Skills

Advanced Designer-Leitfaden zum Trainieren, Testen und Messen der Qualität eines Document-Skills.