Zum Hauptinhalt springen
Online-Lernen erfolgt zur Laufzeit. Wenn mehr Dokumente verarbeitet werden, werden einige davon vom System gesammelt und den Trainings- und Testdatensätzen des Skills hinzugefügt. Der Skill verbessert sich dann in Echtzeit anhand dieser Datensätze. Online-Lernen ist für Document-Skills und Klassifizierungs‑Skills verfügbar.
Hinweis: Online-Lernen ist nicht für Skills verfügbar, die für die Verarbeitung strukturierter Dokumente konzipiert sind. In diesen Fällen ist die Option Collect documents and learn deaktiviert. Dokumente werden weiterhin gesammelt, aber es findet kein Lernen statt.

Wie Online Learning funktioniert

Hinweis: In diesem Abschnitt wird vorausgesetzt, dass Ihr Process-Skill eine Phase zur Manuellen Überprüfung enthält und dass die Funktion Online Learning aktiviert wurde.
Der Online-Learning-Prozess lässt sich wie folgt skizzieren:
  1. Neue Dokumente werden gesammelt und entweder dem Trainingssatz oder dem Testsatz zugeordnet.
  2. Eine Lernsitzung wird mit dem Trainingssatz gestartet.
  3. Das Skill wird getestet.

Schritt 1. Wie Dokumente erfasst werden

Dokumente werden wie folgt erfasst:
  1. Online Learning beginnt Dokumente zu erfassen, sobald das erste korrigierte Dokument von einem Operator für die Manuelle Überprüfung vorliegt.
    • Bei einem Document-Skill ist dies das erste Dokument, bei dem der Bereich von mindestens einem Feld korrigiert wurde.
    • Bei einem Klassifizierungs‑Skill ist dies das erste Dokument, dessen Typ geändert wurde.
  2. Nachdem das erste Dokument erfasst wurde, werden die folgenden Dokumente gesammelt:
    • Alle Dokumente, die die Manuelle Überprüfung durchlaufen haben.
    • Einige Dokumente, die die Manuelle Überprüfung nicht durchlaufen haben (ihr Anteil überschreitet nicht 33 % aller Dokumente im Trainings- und Testdatensatz zusammen).
  3. Wenn neue Dokumente erfasst werden, werden sie entweder in den Trainingsdatensatz oder in den Testdatensatz aufgenommen.
    • Die maximale Anzahl von Dokumenten im Trainingsdatensatz beträgt 10.000. Die maximale Anzahl von Dokumenten im Testdatensatz beträgt 1.000.
Hinweis: Diese Grenzwerte können überschritten werden, wenn der Trainingsdatensatz bereits mehr als 10.000 Dokumente enthält, wenn Online learning beginnt, neue Dokumente zu erfassen. In diesem Fall ersetzt jedes neue Dokument, das zu einem überfüllten Datensatz hinzugefügt wird, das älteste vorhandene Dokument in diesem Datensatz.
  • Dokumente werden nur in den Trainingsdatensatz aufgenommen, bis die Anzahl der Dokumente im Trainingsdatensatz 30 erreicht. Sobald diese Anzahl erreicht ist, werden Dokumente entweder in den Trainingsdatensatz oder in den Testdatensatz aufgenommen.
  • Solange beide Datensätze nicht voll sind, hat jedes neue Dokument eine Chance von 80 %, im Trainingsdatensatz zu landen, und eine Chance von 20 %, im Testdatensatz zu landen.
  • Wenn einer der Datensätze voll ist, werden neue Dokumente in den jeweils anderen Datensatz aufgenommen, bis auch dieser voll ist.
  • Wenn beide Datensätze voll sind, können neue Dokumente weiterhin in einen der Datensätze aufgenommen werden, wobei sie die jeweils ältesten vorhandenen Dokumente ersetzen.
  • Wenn beide Datensätze voll sind, hat jedes neue Dokument eine Chance von 20 %, in einen der Datensätze aufgenommen zu werden, und eine Chance von 80 %, verworfen zu werden.
  • Wenn beide Datensätze voll sind, hat jedes neue Dokument, das nicht verworfen wurde, eine Chance von 80 %, im Trainingsdatensatz zu landen, und eine Chance von 20 %, im Testdatensatz zu landen, wobei es das jeweils älteste vorhandene Dokument im entsprechenden Datensatz ersetzt.
Ablaufschema des Online-Learning-Prozesses

Schritt 2. Wann eine Lernsitzung gestartet wird

  • Handelt es sich um die erste Lernsitzung nach der Veröffentlichung der Skill-Version, startet sie, sobald der Dokumentensatz 10 % neue Dokumente enthält. Beispiel: Gibt es insgesamt 95 Dokumente im Dokumentensatz, beginnt eine neue Lernsitzung, nachdem 10 neue Dokumente hinzugefügt wurden.
  • War die letzte Lernsitzung erfolgreich und wurde die Skill aktualisiert, beginnt eine neue Sitzung unter denselben Bedingungen wie die erste Sitzung.
  • War die letzte Lernsitzung nicht erfolgreich und wurde die Skill nicht aktualisiert, startet eine neue Lernsitzung, sobald der Dokumentensatz 5 % neue Dokumente enthält. Beispiel: Gibt es insgesamt 95 Dokumente im Dokumentensatz, beginnt eine neue Lernsitzung, nachdem 5 neue Dokumente hinzugefügt wurden.

Schritt 3. Wie der Skill getestet wird

Der Skill wird aktualisiert, wenn Online Learning die Genauigkeit um mindestens 1 % erhöht. Die Genauigkeit des Skills wird wie folgt geprüft:
  • Befinden sich mindestens 20 Dokumente im Testset, wird der Skill auf dem Testset getestet.
  • Befinden sich weniger als 20 Dokumente im Testset:
    • Ein Document-Skill wird sowohl auf dem Trainingsset als auch auf dem Testset getestet.
    • Für einen Klassifizierungs‑Skill gilt: Wenn im Dokumentset nicht genügend Dokumente vorhanden sind (wenn jede Klasse weniger als fünf Dokumente hat), wird der Skill sowohl auf dem Trainingsset als auch auf dem Testset getestet. Wenn genügend Dokumente vorhanden sind, wird zur Bewertung der Genauigkeit Cross-Validation verwendet.
Anschließend werden weitere Dokumente gesammelt und eine neue Lernsitzung gestartet.
Hinweis: Online Learning erstellt keine neue Version des Skills. Eine neue Version entsteht nur, wenn ein Skill veröffentlicht wird. Siehe Publishing a skill.