Zum Hauptinhalt springen
Die Feldextraktion kann vom Administrator trainiert werden, wenn ein Projekt trainiert werden muss, bevor die Operatoren mit der Arbeit daran beginnen. Ein Training durch den Administrator kann auch erforderlich sein, wenn sich das automatische Lernen als unzureichend erweist.
Gehen Sie im Standardszenario wie folgt vor:
  1. Erstellen Sie eine Document Definition.
  2. Wählen Sie in den Abschnittseigenschaften der Document Definition die Option Allow field location training aus.
  3. Erstellen Sie die erforderlichen Felder im Abschnitt. Wählen Sie in den Eigenschaften jedes Felds die Option Can have region aus.
  4. Speichern und veröffentlichen Sie die Document Definition.
  5. Wechseln Sie in den Modus Field Extraction Training Batches und erstellen Sie einen neuen Batch.
  6. Wählen Sie die Document Definition aus, die Sie erstellt haben.
  7. Wählen Sie in der Variantenliste die Variante Default aus.
  8. Laden Sie Dokumentbilder und führen Sie die Erkennung durch. Wir empfehlen, für jede Dokumentart 3 bis 50 Bilder zu laden.
  9. Passen Sie die Positionen der Felder an.
  10. Legen Sie für Ihre Dokumente die folgenden Status fest:
  • Wählen Sie einige der Dokumente aus, klicken Sie mit der rechten Maustaste auf die Auswahl, und klicken Sie im Kontextmenü auf Set Document State → For training.
  • Wählen Sie die übrigen Dokumente aus, klicken Sie mit der rechten Maustaste auf die Auswahl, und klicken Sie im Kontextmenü auf Set Document State → For testing. Hinweis: Wir empfehlen, 60 % der Dokumente im Trainings-Batch für das Training und die restlichen 40 % zum Testen zu verwenden.
  1. Trainieren Sie das Programm, damit es die Felder extrahiert:
  • (Standalone) Klicken Sie auf Fields Training → (Standalone) Train
    • (Distributed) Klicken Sie auf Fields Training → (Distributed) Train, um das Training auf demselben Rechner zu starten, auf dem die Komponente Project Setup Station installiert ist.
    • (Distributed) Klicken Sie mit der rechten Maustaste auf den Batch und wählen Sie im Kontextmenü (Distributed) Send for Training aus, wenn das Training auf einer Processing Station durchgeführt werden soll.
Bei Dokumenten mit variablen Feldpositionen müssen Sie Varianten erstellen und einen Klassifikator trainieren, um diese Varianten zu unterscheiden. Weitere Informationen zu Dokumenten mit variablen Feldpositionen und Varianten finden Sie unter Variable Feldpositionen in Dokumenten desselben Typs.Führen Sie die folgenden Schritte aus:
  1. Erstellen Sie eine Document Definition.
  2. Wählen Sie in den Abschnittseigenschaften der Document Definition die Option Allow field location training aus.
  3. Erstellen Sie die erforderlichen Felder im Abschnitt. Wählen Sie in den Eigenschaften jedes Felds die Option Can have region aus.
  4. Fügen Sie Abschnittsvarianten mit einer der folgenden drei Methoden hinzu:
    • Erstellen Sie Varianten manuell. Klicken Sie dazu in den Abschnittseigenschaften auf die Registerkarte Data Sets und dann auf die Schaltfläche View… Klicken Sie anschließend auf die Schaltfläche Add…, um Varianten hinzuzufügen.
    • Laden Sie Varianten aus einer Datenbank. Klicken Sie dazu in den Abschnittseigenschaften auf die Registerkarte Data Sets und dann auf die Schaltfläche Set Up… Wählen Sie in der Dropdown-Liste Database als Datenquelle aus.
    • Erstellen Sie Varianten mithilfe eines Skripts. Klicken Sie dazu in den Abschnittseigenschaften auf die Registerkarte Data Sets und dann auf die Schaltfläche Set Up… Wählen Sie in der Dropdown-Liste Script als Datenquelle aus.
  5. Speichern und veröffentlichen Sie die Document Definition.
  6. Trainieren Sie einen Klassifikator mit den neu erstellten Varianten:
    • Wechseln Sie in den Modus Open Classifier Training Batches und laden Sie Dokumentbilder in einen neuen Batch.
    • Weisen Sie jedem Dokument eine Referenzklasse zu, wobei Varianten als separate Klassen verwendet werden:
      • Klicken Sie auf Set Class… → Add… → Add…
      • Wählen Sie Specify variant aus.
      • Wählen Sie eine Variante aus der Liste aus.
    • Trainieren Sie einen Klassifikator, indem Sie auf Classification Training → Train klicken.
Hinweis: Sie können in FlexiLayout Studio einen Klassifikator erstellen und ihn dann in ABBYY FlexiCapture importieren. Einzelheiten finden Sie unter Klassifikatoren exportieren und importieren.
  1. Trainieren Sie ABBYY FlexiCapture so, dass die Feldregionen für jede Variante erkannt werden:
    • Wechseln Sie in den Modus Field Extraction Training Batches.
    • Erstellen Sie einen neuen Batch. Wählen Sie Ihre Document Definition und dann eine zu trainierende Variante aus.
    • Laden Sie Dokumentbilder und erkennen Sie sie. Wir empfehlen, für jede Dokumentart 3 bis 50 Bilder zu laden.
    • Passen Sie die Positionen der Felder an.
    • Legen Sie für Ihre Dokumente die folgenden Status fest:
      • Wählen Sie einige der Dokumente aus, klicken Sie mit der rechten Maustaste auf die Auswahl und klicken Sie dann im Kontextmenü auf Set Document State → For training.
      • Wählen Sie die übrigen Dokumente aus, klicken Sie mit der rechten Maustaste auf die Auswahl und klicken Sie dann im Kontextmenü auf Set Document State → For testing.
    • Trainieren Sie das Programm für die Feldextraktion:
      • (Standalone) Klicken Sie auf Fields Training → (Standalone) Train
      • (Distributed) Klicken Sie auf Fields Training → (Distributed) Train, um das Training auf demselben Computer zu starten, auf dem die Komponente Project Setup Station installiert ist.
      • (Distributed) Klicken Sie mit der rechten Maustaste auf den Batch und wählen Sie im Kontextmenü (Distributed) Send for Training aus, wenn das Training auf einer Processing Station durchgeführt werden soll.
Bei der Arbeit mit den Trainingsergebnissen müssen Sie möglicherweise prüfen, welche Variante einem Dokument zugewiesen wurde, und sie bei Bedarf bearbeiten. Um die IDs der Varianten im Formular anzuzeigen, erstellen Sie ein Service-Feld. Einzelheiten finden Sie unter Operatoren das Ändern von Varianten ermöglichen.
Wir empfehlen, automatisches Lernen für die Feldextraktion zu konfigurieren. Wenn automatisches Lernen konfiguriert ist, lernt das Programm automatisch, Felder zu extrahieren, während die Operatoren im konfigurierten Projekt arbeiten.

(Distributed) Trainings-Batches zum Training an eine Processing Station senden

(Distributed) Da der Trainingsprozess lange dauern und viele Rechenressourcen beanspruchen kann, kann der Administrator festlegen, dass Batches auf einer Processing Station trainiert werden.
(Distributed) Bevor Sie einen Trainings-Batch an eine Processing Station senden, stellen Sie bitte sicher, dass:
  • (Distributed) Dem Processing Server mindestens eine Processing Station hinzugefügt wurde.
  • (Distributed) Das Projekt auf den Server hochgeladen wurde.
(Distributed) Um einen Trainings-Batch an eine Processing Station zu senden, klicken Sie mit der rechten Maustaste auf den Batch und wählen Sie im Kontextmenü (Distributed) Send for Training. Sobald der Batch gesendet wurde, erscheint im Processing Server Monitor eine Trainingsaufgabe in der Aufgabenwarteschlange. Das Training selbst findet auf der Processing Station statt. Es können mehrere Trainings-Batches zum Training an eine Processing Station gesendet werden. Falls erforderlich, kann der Administrator eine Trainingsaufgabe im Processing Server Monitor abbrechen. Zum Training gesendete Trainings-Batches sind gesperrt, bis ihr Training abgeschlossen ist, und der Administrator kann an solchen Trainings-Batches keine Änderungen vornehmen.