Zum Hauptinhalt springen
Die Fast-Learning-Aktivität wird verwendet, um Felder aus strukturierten und halbstrukturierten Dokumenten zu extrahieren. Sie ermöglicht außerdem das Trainieren der als Ausgabefelder für diese Aktivität ausgewählten Felder, während Dokumente in Vantage verarbeitet werden. Weitere Informationen finden Sie im Vantage Runtime Guide unter Online Learning. Sie können das Feldtraining ausdrücklich deaktivieren, indem Sie es im Bereich Activity Properties abwählen. Wenn Sie die Fast-Learning-Aktivität nicht zu Ihrem Dokumentverarbeitungsablauf hinzufügen, ist es nicht möglich, Felder zu trainieren, nachdem Sie Ihr Skill erstellt und veröffentlicht haben. Wenn Sie ein in Vantage erstelltes Skill bearbeiten, kann das Skill eine vortrainierte Fast-Learning-Aktivität enthalten. Sie können weitere Aktivitäten hinzufügen und sie mit der vortrainierten kombinieren. Weitere Informationen finden Sie unter Bearbeiten eines in Vantage erstellten und trainierten Skills.
Hinweis: Die Fast-Learning-Aktivität kann keine komplexen Strukturen extrahieren (z. B. verschachtelte Tabellen, also wiederholende Strukturen innerhalb anderer Tabellen) und keine Felder des Typs Image. Um solche Strukturen zu extrahieren, verwenden Sie die Extraction Rules activity.

Anwendungsfälle

Fügen Sie diese Aktivität in den folgenden Fällen Ihrem Dokumentenverarbeitungsfluss hinzu:
  • Wenn der Dokumentensatz mehrere Varianten des Dokumentenlayouts umfasst und Sie für jede Variante während des Trainings Beispiele bereitstellen können. Zum Beispiel, wenn Sie die Extraktion aus Kontoauszügen verschiedener Banken trainieren möchten und Ihnen von jeder Bank Beispiele vorliegen.
  • Wenn Sie planen, Dokumentvarianten zu verarbeiten, für die Ihr Skill noch nicht trainiert wurde, und Sie von Online Learning profitieren möchten. Beim Verarbeiten von Rechnungen hat beispielsweise jeder Lieferant sein eigenes Rechnungslayout; zudem können täglich neue Lieferanten hinzukommen. In diesem Fall verwenden Sie andere Aktivitäten, um Daten aus den Dokumenten zu extrahieren, können aber auch die Aktivität Fast Learning zum Verarbeitungsfluss hinzufügen; sie wird zur Laufzeit anhand des Online-Learning-Feedbacks aus der Schleife der Manuellen Überprüfung trainiert.
  • Wenn Sie Felder trainieren möchten, während Dokumente in Vantage verarbeitet werden.

Funktionsweise

Fast Learning basiert auf einer Clustering-Technologie, die ähnlich aussehende Dokumentlayouts gruppiert und intern für jeden Cluster ein Feldextraktionsmodell trainiert. Die Fast-Learning-Aktivität kann Tausende verschiedener Dokumentvarianten erlernen. Im Gegensatz zur Deep-Learning-Aktivität neigt die Fast-Learning-Aktivität dazu, sich zu merken, was sie „gesehen“ hat, statt Bildmuster zu erlernen. Fast Learning kann nicht auf neue Dokumentvarianten verallgemeinern, denen es noch nicht begegnet ist. Wenn eine Fast-Learning-Aktivität zur Laufzeit auf ein neues Dokument trifft, ermittelt sie, welchem Cluster das Dokument am ähnlichsten ist, und wendet dann das entsprechende interne Modell an. Für diese Aktivität ist kein großer Trainingsdatensatz erforderlich – ein Dokument genügt, um mit dem Training zu beginnen. Wenn Sie mehrere Varianten desselben Dokuments haben (zum Beispiel Dokumente, die im Wesentlichen identisch sind, aber etwas unterschiedlich aussehen), empfehlen wir, Dokumente einzuschließen, die jede Variante repräsentieren. Weitere Informationen finden Sie unter Einrichten einer Fast-Learning-Aktivität.