Zum Hauptinhalt springen
Nachdem Sie eine Document-Skill erstellt haben, gehen Sie wie folgt vor, um die Skill einzurichten:
  1. Laden Sie die Dokumente hoch, die Sie zum Trainieren und Testen des Klassifikators verwenden möchten (jede Datei darf nur ein einzelnes Dokumentbild enthalten). Um Ihre Dokumente hochzuladen, wechseln Sie zur Registerkarte Documents im Skill Designer und klicken Sie auf die Schaltfläche Upload documents in der Mitte des Designers, in der Symbolleiste oder im Bereich Actions. Während des Uploads wird oben im Skill Designer rechts neben den Lesezeichen ein Fortschrittsindikator angezeigt. Der Tooltip des Indikators enthält Informationen über die Anzahl der Dokumente, die noch hochgeladen und verarbeitet werden müssen. Sie können ein Dokumentvorschaufenster öffnen, indem Sie auf das links neben dem Namen eines Dokuments befindliche Symbol klicken. Die Standardbreite dieses Fensters beträgt 35 % der Breite des Browserfensters. Bei Bedarf können Sie die Breite des Vorschaufensters auf bis zu 80 % der Breite des Browserfensters erhöhen, indem Sie die linke Grenze des Vorschaufensters ziehen. Vom Benutzer festgelegte Breiten bleiben erhalten, bis der Browsercache gelöscht wird.
  2. Kennzeichnen Sie in Ihren Trainingsdokumenten alle Felder, aus denen Daten extrahiert werden sollen, und geben Sie deren Position auf dem Bild an. Bei Bedarf können Sie auch Validierungsregeln und Skill-Parameter hinzufügen. Um Felder in Ihren Trainingsdokumenten zu kennzeichnen, wechseln Sie zur Registerkarte Editor des Skill Designer. Dies können Sie entweder tun, indem Sie auf den Namen der Registerkarte klicken, oder indem Sie ein oder mehrere Dokumente aus der Liste auswählen und im Bereich Actions auf Label Fields and Create Business Rules klicken.
  3. Trainieren Sie Ihre Skill und analysieren Sie die Extraktionsgenauigkeit. Korrigieren Sie gegebenenfalls Fehler. Um mit dem Training Ihrer Skill zu beginnen, klicken Sie im Bereich Actions auf die Schaltfläche Train. Sobald das Training abgeschlossen ist, wird neben der Schaltfläche Train Folgendes angezeigt: Completed. Sie können das Training der Skill beenden, indem Sie im Bereich Actions unter der Schaltfläche Train auf Cancel klicken.
  4. Wiederholen Sie die Schritte 1 bis 3, bis Sie mit den Ergebnissen zufrieden sind.
  5. Veröffentlichen Sie Ihre produktive Skill im Skill Catalog, um sie zur Verwendung bereitzustellen.
  6. Bei Bedarf können Sie weitere Skills von Ihrer Skill ableiten. Solche Skills erben alle Regeln und Felder von ihren Basisskills. Außerdem können abgeleitete Skills nahtlos auf die neueste Version ihrer Basisskills aktualisiert werden, wobei alle von Ihnen vorgenommenen Änderungen erhalten bleiben.

Einrichten eines Document-Skills zur Verarbeitung strukturierter Dokumente

ABBYY Vantage bietet einen Machine-Learning-Modus zur Verarbeitung strukturierter Dokumente, d. h. Dokumente, bei denen sich die Position der Felder in jeder Dokumentinstanz an derselben Stelle befindet. Beispiele hierfür sind Fragebögen, Antragsformulare und Steuererklärungen. Dieser Modus kann sogar Dokumente mit mehreren Varianten verarbeiten, wie etwa das IRS Form 1040 für verschiedene Jahre, bei dem sich Umfang und Position der Felder von Jahr zu Jahr leicht unterscheiden. Jede dieser Varianten stellt ein separates strukturiertes Dokument dar, und Sie müssen für jede Variante ein leeres Formular hochladen. Gehen Sie wie folgt vor, um einen Skill zur Verarbeitung strukturierter Dokumente einzurichten:
  1. Erstellen Sie einen neuen Document-Skill und aktivieren Sie für diesen Skill den Schalter Fixed-form documents. Fixed Forms Toggle
  2. Laden Sie für jede Variante Ihres Dokuments ein leeres Formular als Beispiel hoch. Navigieren Sie dazu im Skill Designer zur Registerkarte Blank Form und klicken Sie auf die Schaltfläche Upload Blank Form in der Mitte des Designers, in der Symbolleiste oder im Bereich Actions. Wenn Sie kein leeres Formular haben, können Sie ein ausgefülltes Formular hochladen und es als leeres Formular kennzeichnen.
Hinweis: Ein einzelner Skill kann bis zu 10 verschiedene Varianten eines Formulars verarbeiten (z. B. Varianten des IRS Form 1040 für verschiedene Jahre).
  1. Beschriften Sie die Felder, aus denen Daten extrahiert werden sollen.
  2. Aktivieren Sie in den Feldeinstellungen die Option Eliminate field background für Felder, bei denen der Hintergrund die Erkennung beeinträchtigen kann.
  3. Klicken Sie im Bereich Actions auf Train.
  4. Klicken Sie auf die Registerkarte Test Set und laden Sie ausgefüllte Testdokumente hoch. Stellen Sie sicher, dass alle Felder in jedem Dokument korrekt beschriftet sind. Wenn die Position eines Feldes mit keiner der hochgeladenen leeren Formularvorlagen übereinstimmt, fügen Sie für diese Dokumentvariante ein leeres Formular hinzu.
  5. Testen Sie Ihren Skill im Bereich Actions. Überprüfen Sie nach Abschluss des Vorgangs die Ergebnisse. Wenn Sie mit den Ergebnissen nicht zufrieden sind, passen Sie die Beschriftungen an und trainieren Sie die Aktivität erneut.
  6. Veröffentlichen Sie Ihren Skill im Skill Catalog, um ihn verfügbar zu machen.
Fixed Form Tabs Registerkarten, die im Skill Designer für einen Skill angezeigt werden, der strukturierte Dokumente verarbeitet Bei der Verarbeitung Ihrer Dokumente stellen Sie möglicherweise fest, dass diese eher als halbstrukturierte denn als strukturierte Dokumente behandelt werden sollten. In diesem Fall:
  1. Klicken Sie im Skill Designer auf das Symbol rechts neben dem Skill-Namen.
  2. Deaktivieren Sie den Schalter Fixed-form documents.
Hinweis: Alle beschrifteten Felder bleiben erhalten.
  1. Trainieren Sie Ihren Skill erneut.
Wenn Sie Ihren Skill im Advanced Designer bearbeiten und die Forms-Aktivität mit anderen Aktivitäten kombinieren, ist der Schalter Fixed-form documents in Vantage deaktiviert und Sie können den Skill außerhalb des Advanced Designer nicht mehr bearbeiten.

Arbeiten mit Tabellen und wiederholbaren Gruppen

Beim Verarbeiten strukturierter Dokumente kann Vantage Tabellen und wiederholbare Gruppen verarbeiten, wenn die maximale Anzahl der Tabellenzeilen oder Gruppeninstanzen im Voraus bekannt ist und die Grenzen der Tabelle oder Gruppe fest definiert sind. Sie müssen alle Zeilen beschriften, die in allen Varianten des Formulars möglicherweise vorkommen.
Hinweis: In den Verarbeitungsergebnissen werden nur Zeilen mit Daten angezeigt. Leere Zeilen werden ignoriert.
Wenn die Anzahl der Zeilen oder Instanzen in einer Gruppe nicht im Voraus bekannt ist, müssen Sie eine andere Vantage-Technologie verwenden, siehe Verarbeitung strukturierter Dokumente.
Hinweis: Derzeit können nur Tabellen mit Textwerten verarbeitet werden. Wenn Ihre Tabelle Spalten mit Kontrollkästchen oder Barcodes enthält, verwenden Sie stattdessen eine wiederholbare Gruppe.

Erkennungssprache einrichten

Bei der Verarbeitung eines Dokuments wählt Vantage eine Verarbeitungssprache aus einer Liste festgelegter Sprachen. Beim Einrichten eines neuen Skills sind standardmäßig die folgenden vier Sprachen ausgewählt: Englisch, Französisch, Deutsch und Spanisch. Die Liste der Erkennungssprachen kann geändert werden, indem Sie auf das icon rechts neben dem Skill-Namen im Skill Designer klicken. Die im Einstellungsdialog angezeigten Sprachen sind alphabetisch sortiert. Die ausgewählten Sprachen werden oben in der Liste angezeigt. Es muss mindestens eine Sprache ausgewählt sein. Um den Einstellungsdialog zu schließen, klicken Sie entweder auf Save, um Ihre Änderungen zu behalten, oder auf Cancel, um Ihre Änderungen zu verwerfen.
Hinweis: Die Anzahl der ausgewählten Sprachen kann die Geschwindigkeit der Dokumentverarbeitung beeinflussen. Wenn Sie genau wissen, welche Sprachen Vantage in Ihren Dokumenten verarbeiten wird, empfehlen wir, die Auswahl auf diese Sprachen zu beschränken.
Sie können die Liste der Erkennungssprachen eines Skills auch ändern, wenn der Skill bereits trainiert wurde. Um Ihre Änderungen anzuwenden, laden Sie die Dokumente erneut hoch und trainieren Sie den Skill neu.

Einrichten des Online-Lernmodus

Online-Lernen ist für Document-Skills und Klassifizierungs‑Skills verfügbar. Der Online-Learning-Dienst sammelt Dokumente in einem Trainingssatz und trainiert den Skill anschließend mit den gesammelten Dokumenten weiter. In den Document-Skill-Einstellungen sind die folgenden Online-Lernmodi verfügbar:
  • Sammeln und lernen. Standardoption.
  • Nur sammeln. Wenn im Skill Designer Dokumente ohne Training gesammelt werden sollen.
Um das Sammeln von Dokumenten ohne Training zu aktivieren, klicken Sie im Skill Designer auf das Symbol rechts neben dem Skill-Namen und wählen Sie im Einstellungsdialog den Modus Nur sammeln. In diesem Modus können Sie die dem Trainingssatz hinzugefügten Dokumente überprüfen, bevor der Skill erneut trainiert wird. Nur-sammeln-Modus

Siehe auch