Zum Hauptinhalt springen
Die zu verarbeitenden Dokumente lassen sich anhand des Layouts in zwei Klassen unterteilen. Für jede Klasse möchten wir einen eigenen Satz von Extraktionsregeln erstellen. Außerdem soll unser Skill mit den Standardtechnologien von Vantage trainierbar sein. Konfigurieren wir den Dokumentverarbeitungsfluss des Skills gemäß diesen Anforderungen.
  1. Wechseln Sie zur Registerkarte Activities.
  2. Zunächst müssen wir die Dokumentklasse bestimmen. Dazu verwenden wir eine Klassifizierungsaktivität. Klicken Sie im Bereich Activities auf die Aktivität Classify By Text and Image. Sie wird dem Workflow hinzugefügt. Beim Hinzufügen dieser Aktivität wird in der Skill-Struktur ein neues Feld erstellt. Dieses Feld dient zur Protokollierung der Klassifizierungsergebnisse und wird in der Feldstruktur des Skills angezeigt; es ist jedoch als verborgenes Feld markiert und nicht bearbeitbar. Sie können den Namen dieses Feldes im Bereich Activity Properties auf der Registerkarte Activities ändern. Benennen Sie das Feld in “Layout” um.
  3. Abhängig vom Klassifizierungsergebnis sollen Dokumente zu unterschiedlichen Aktivitäten innerhalb des Verarbeitungsflusses geleitet werden. Um den Workflow aufzuteilen, fügen Sie die Aktivität IF ein: a. Klicken Sie im Workflow auf die Aktivität Classify By Text and Image. b. Wählen Sie im Pop-up-Fenster das Element IF aus. Es wird dem Workflow nach der Aktivität Classify By Text and Image hinzugefügt.
Hinweis: Anstelle der Aktivität IF können Sie ein Workflow-Element erstellen, das zwei Aktivitäten Extraction Rules enthält, und das Feld “Layout” als Quellfeld auswählen, sodass dessen Werte als Bedingungen dafür dienen, welche Aktivität auf jedes Dokument angewendet wird. Weitere Informationen zu dieser Option finden Sie unter Mehrere Sätze von Extraktionsregeln innerhalb einer einzigen Aktivität.
  1. Jetzt fügen wir die Aktivitäten zum Extrahieren von Daten aus Dokumenten unterschiedlicher Klassen hinzu. a. Wählen Sie die Aktivität Extraction Rules als nächstes Element. Benennen Sie sie in “Sick Note DE” um. Diese Aktivität extrahiert Daten aus den deutschen Dokumenten. b. Nun benötigen wir eine Aktivität, die Daten aus belgischen und niederländischen Dokumenten extrahiert. Innerhalb dieser Dokumentklasse gibt es Varianten, die jedoch von einer einzelnen Extraction Rules-Aktivität verarbeitet werden können. Klicken Sie auf die Aktivität IF und fügen Sie dem Workflow eine weitere Aktivität Extraction Rules hinzu. Benennen Sie die Aktivität in “Sick Note BE-NL” um. Die Aktivität IF sollte jetzt mit beiden Aktivitäten Extraction Rules sowie mit Finish verbunden sein.
  2. Wir möchten, dass Vantage den Skill anhand der verarbeiteten Dokumente weitertrainiert. Dazu müssen wir am Ende des Workflows die Aktivität Fast Learning hinzufügen. Wir werden diese Aktivität auch bei der Konfiguration des Skills trainieren, das Hauptziel ist jedoch, während des Betriebs Online Learning für den Skill zu aktivieren. a. Klicken Sie im Verarbeitungsfluss auf “Sick Note BE-NL”. b. Wählen Sie im Pop-up-Fenster die Aktivität Fast Learning aus. Sie wird nach der Aktivität “Sick Note BE-NL” hinzugefügt, aber die Aktivität “Sick Note DE” bleibt weiterhin mit Finish verbunden. c. Fahren Sie mit der Maus über den Pfeil, der die Aktivität “Sick Note DE” mit Finish verbindet. Der Pfeil sollte orange werden. d. Ziehen Sie diesen Pfeil per Drag-and-drop auf die Aktivität Fast Learning. e. Fahren Sie mit der Maus über den Pfeil, der die Aktivität IF mit Finish verbindet. Ziehen Sie auch diesen Pfeil per Drag-and-drop auf die Aktivität Fast Learning. Jetzt werden alle Dokumente an die Aktivität Fast Learning weitergeleitet.
Ihre endgültige Einrichtung sollte folgendermaßen aussehen: Workflow diagram showing the processing pipeline Die Ausrufezeichen zeigen an, dass die Aktivitäten noch nicht konfiguriert wurden. Wir werden sie in den nächsten Schritten konfigurieren.