Zum Hauptinhalt springen
Die Fast Learning-Aktivität wird verwendet, um Felder aus strukturierten und halbstrukturierten Dokumenten zu extrahieren. Sie ermöglicht außerdem das Training der als Ausgabe für diese Aktivität ausgewählten Felder, während Dokumente in Vantage verarbeitet werden. Weitere Informationen finden Sie im Vantage Runtime Guide unter Online Learning. Sie können das Feldtraining explizit deaktivieren, indem Sie es im Bereich Activity Properties abwählen. Wenn Sie die Fast Learning-Aktivität nicht zu Ihrem Dokumentverarbeitungsfluss hinzufügen, ist es nicht möglich, Felder zu trainieren, nachdem Sie Ihr Skill erstellt und veröffentlicht haben. Wenn Sie ein in Vantage erstelltes Skill bearbeiten, kann das Skill eine vortrainierte Fast Learning-Aktivität enthalten. Sie können weitere Aktivitäten hinzufügen und sie mit der vortrainierten kombinieren. Weitere Informationen finden Sie unter Bearbeiten eines in Vantage erstellten und trainierten Skills.
Hinweis: Die Fast Learning-Aktivität kann keine komplexen Strukturen extrahieren (z. B. verschachtelte Tabellen, also sich wiederholende Strukturen innerhalb anderer Tabellen) und keine Felder vom Typ Image. Um solche Strukturen zu extrahieren, verwenden Sie die Extraction Rules-Aktivität.

Anwendungsfälle

Fügen Sie diese Aktivität in den folgenden Fällen Ihrem Dokumentenverarbeitungsfluss hinzu:
  • Wenn der Dokumentensatz mehrere Varianten des Dokumentenlayouts umfasst und Sie für jede Variante während des Trainings Beispiele bereitstellen können. Zum Beispiel, wenn Sie die Extraktion aus Kontoauszügen verschiedener Banken trainieren möchten und Ihnen von jeder Bank Beispiele vorliegen.
  • Wenn Sie planen, Dokumentvarianten zu verarbeiten, für die Ihr Skill noch nicht trainiert wurde, und Sie von Online Learning profitieren möchten. Beim Verarbeiten von Rechnungen hat beispielsweise jeder Lieferant sein eigenes Rechnungslayout; zudem können täglich neue Lieferanten hinzukommen. In diesem Fall verwenden Sie andere Aktivitäten, um Daten aus den Dokumenten zu extrahieren, können aber auch die Aktivität Fast Learning zum Verarbeitungsfluss hinzufügen; sie wird zur Laufzeit anhand des Online-Learning-Feedbacks aus der Schleife der Manuellen Überprüfung trainiert.
  • Wenn Sie Felder trainieren möchten, während Dokumente in Vantage verarbeitet werden.

Funktionsweise

Fast Learning basiert auf einer Clustering-Technologie, die ähnlich aussehende Dokumentlayouts gruppiert und intern für jeden Cluster ein Feldextraktionsmodell trainiert. Die Aktivität „Fast Learning“ kann Tausende verschiedener Dokumentvarianten lernen. Im Gegensatz zur Aktivität „Deep Learning“ merkt sich „Fast Learning“ eher, was es „gesehen“ hat, statt Bildmuster zu lernen. Fast Learning kann nicht auf neue Dokumentvarianten generalisieren, denen es noch nicht begegnet ist. Wenn eine Fast-Learning-Aktivität zur Laufzeit auf ein neues Dokument trifft, ermittelt sie, welchem Cluster das Dokument am ähnlichsten ist, und wendet dann das entsprechende interne Modell an. Diese Aktivität erfordert keinen großen Trainingsdatensatz — ein Dokument reicht aus, um mit dem Training zu beginnen. Wenn Sie mehrere Varianten desselben Dokuments haben (zum Beispiel Dokumente, die im Wesentlichen identisch sind, aber etwas unterschiedlich aussehen), empfehlen wir, Dokumente für jede Variante in den Trainingsdatensatz aufzunehmen. Weitere Informationen finden Sie unter Einrichten einer Fast-Learning-Aktivität.