Zum Hauptinhalt springen
Die Dokumente, die wir verarbeiten, lassen sich anhand des Layouts in zwei Klassen unterteilen. Für jede Klasse möchten wir einen eigenen Satz von Extraktionsregeln erstellen. Außerdem soll unser Skill mit den Standardtechnologien von Vantage trainierbar sein. Konfigurieren wir den Dokumentverarbeitungsfluss des Skills entsprechend diesen Anforderungen.
  1. Gehen Sie zur Registerkarte Activities.
  2. Zuerst müssen wir die Dokumentklasse bestimmen. Dazu verwenden wir eine Klassifizierungsaktivität. Klicken Sie im Bereich Activities auf die Aktivität Classify By Text and Image. Sie wird dem Workflow hinzugefügt. Beim Hinzufügen dieser Aktivität wird in der Skill-Struktur ein neues Feld erstellt. Dieses Feld dient zur Protokollierung der Klassifizierungsergebnisse und wird in der Skill-Feldstruktur angezeigt, ist jedoch als verborgenes Feld markiert und nicht bearbeitbar. Sie können den Namen dieses Felds im Bereich Activity Properties auf der Registerkarte Activities ändern. Benennen Sie das Feld in “Layout” um.
  3. Abhängig von den Klassifizierungsergebnissen sollen Dokumente zu verschiedenen Aktivitäten innerhalb des Verarbeitungsflusses geleitet werden. Um den Workflow aufzuteilen, fügen Sie die Aktivität IF ein: a. Klicken Sie im Workflow auf die Aktivität Classify By Text and Image. b. Wählen Sie im Pop-up-Fenster das Element IF aus. Es wird nach der Aktivität Classify By Text and Image zum Workflow hinzugefügt.
Hinweis: Anstatt die Aktivität IF zu verwenden, können Sie ein Workflow-Element erstellen, das zwei Aktivitäten Extraction Rules enthält, und das Feld “Layout” als Quellfeld auswählen, sodass dessen Werte als Bedingungen dafür dienen, welche Aktivität auf jedes Dokument angewendet wird. Weitere Informationen zu dieser Option finden Sie unter Mehrere Sätze von Extraction Rules innerhalb einer einzelnen Aktivität.
  1. Nun fügen wir die Aktivitäten zum Extrahieren von Daten aus Dokumenten unterschiedlicher Klassen hinzu. a. Wählen Sie als Nächstes die Aktivität Extraction Rules aus. Benennen Sie sie in “Sick Note DE” um. Diese Aktivität extrahiert Daten aus den deutschen Dokumenten. b. Jetzt benötigen wir eine Aktivität, die Daten aus belgischen und niederländischen Dokumenten extrahiert. Innerhalb dieser Dokumentklasse gibt es Varianten, die jedoch von einer einzigen Extraction Rules-Aktivität verarbeitet werden können. Klicken Sie auf die Aktivität IF und fügen Sie dem Workflow eine weitere Aktivität Extraction Rules hinzu. Benennen Sie die Aktivität in “Sick Note BE-NL” um. Die Aktivität IF sollte nun mit beiden Aktivitäten Extraction Rules sowie mit Finish verbunden sein.
  2. Wir möchten, dass Vantage den Skill mit den verarbeiteten Dokumenten weiter trainiert. Dazu müssen wir am Ende des Workflows die Aktivität Fast Learning hinzufügen. Wir werden diese Aktivität auch beim Konfigurieren des Skills trainieren, aber die Hauptidee ist, Online Learning für den Skill im Betrieb zu aktivieren. a. Klicken Sie im Verarbeitungsfluss auf “Sick Note BE-NL”. b. Wählen Sie im Pop-up-Fenster die Aktivität Fast Learning aus. Sie wird nach der Aktivität “Sick Note BE-NL” hinzugefügt, aber die Aktivität “Sick Note DE” bleibt weiterhin mit Finish verbunden. c. Fahren Sie mit der Maus über den Pfeil, der die Aktivität “Sick Note DE” mit Finish verbindet. Der Pfeil sollte orange werden. d. Ziehen Sie diesen Pfeil per Drag-and-drop auf die Aktivität Fast Learning. e. Fahren Sie mit der Maus über den Pfeil, der die Aktivität IF mit Finish verbindet. Ziehen Sie auch diesen Pfeil per Drag-and-drop auf die Aktivität Fast Learning. Jetzt werden alle Dokumente an die Aktivität Fast Learning weitergeleitet.
Ihre endgültige Einrichtung sollte so aussehen: Workflow diagram showing the processing pipeline Die Ausrufezeichen zeigen an, dass die Aktivitäten noch nicht konfiguriert wurden. Wir werden sie in den nächsten Schritten konfigurieren.