Zum Hauptinhalt springen
Online Learning läuft zur Laufzeit. Das System sammelt Dokumente während der Verarbeitung, fügt sie den Trainings- und Testdatensätzen des Skills hinzu und verbessert den Skill in Echtzeit mithilfe dieser Datensätze. Online Learning ist für Document-Skills und Klassifizierungs-Skills verfügbar.
Online Learning ist für Skills, die für die Verarbeitung strukturierter Dokumente entwickelt wurden, nicht verfügbar. Für diese Skills ist die Option Dokumente sammeln und lernen deaktiviert — das System sammelt weiterhin Dokumente, lernt jedoch nicht aus ihnen.

Wie Online Learning funktioniert

In diesem Abschnitt wird vorausgesetzt, dass Ihr Process-Skill eine Phase zur Manuellen Überprüfung enthält und dass die Funktion Online Learning aktiviert ist.
Im Groben umfasst Online Learning drei Phasen:
  1. Das System sammelt neue Dokumente und ordnet sie entweder dem Trainingsdatensatz oder dem Testdatensatz zu.
  2. Das System startet mit dem Trainingsdatensatz eine Lernsitzung.
  3. Das System testet das aktualisierte Skill.

Schritt 1. Wie Dokumente erfasst werden

Das System erfasst Dokumente wie folgt:
  1. Online Learning beginnt mit der Erfassung von Dokumenten, sobald das erste korrigierte Dokument von einem Operator für die manuelle Überprüfung eingeht.
    • Bei einem Document-Skill ist dies das erste Dokument, bei dem die Region mindestens eines Felds korrigiert wurde.
    • Bei einem Klassifizierungs‑Skill ist dies das erste Dokument, dessen Typ geändert wurde.
  2. Nachdem das System das erste Dokument erhalten hat, erfasst es:
    • Alle Dokumente, die die manuelle Überprüfung durchlaufen haben.
    • Einige Dokumente, die die manuelle Überprüfung nicht durchlaufen haben (ihr Anteil überschreitet 33 % aller Dokumente im Trainingsdatensatz und Testdatensatz zusammen nicht).
  3. Beim Erfassen neuer Dokumente ordnet das System sie entweder dem Trainingsdatensatz oder dem Testdatensatz zu.
    • Die maximale Anzahl von Dokumenten im Trainingsdatensatz beträgt 10.000. Die maximale Anzahl von Dokumenten im Testdatensatz beträgt 1.000.
    Diese Grenzwerte können überschritten werden, wenn der Trainingsdatensatz bereits mehr als 10.000 Dokumente enthält, wenn Online Learning mit der Erfassung neuer Dokumente beginnt. In diesem Fall ersetzt jedes neue Dokument, das einem überfüllten Datensatz hinzugefügt wird, das älteste vorhandene Dokument in diesem Datensatz.
Wie Dokumente auf die Datensätze verteilt werden:
  • Bis der Trainingsdatensatz 30 Dokumente enthält — jedes Dokument wird dem Trainingsdatensatz zugeordnet.
  • Sobald der Trainingsdatensatz mindestens 30 Dokumente enthält und beide Datensätze noch aufgefüllt werden — jedes neue Dokument wird mit einer Wahrscheinlichkeit von 80 % dem Trainingsdatensatz und mit einer Wahrscheinlichkeit von 20 % dem Testdatensatz zugeordnet.
  • Sobald ein Datensatz voll ist — neue Dokumente gehen in den anderen Datensatz, bis auch dieser voll ist.
  • Sobald beide Datensätze voll sind — 80 % der neuen Dokumente werden verworfen. Von den verbleibenden 20 % gehen 80 % in den Trainingsdatensatz und 20 % in den Testdatensatz; dabei ersetzt jedes das älteste vorhandene Dokument in diesem Datensatz.
Flussdiagramm zur Dokumenterfassung in Trainings- und Testdatensätze, zu Auslösern für Lernsitzungen und zum Testen der Skill-Genauigkeit

Schritt 2. Wann eine Lernsitzung gestartet wird

  • Wenn dies die erste Lernsitzung nach der Veröffentlichung der Skill-Version ist, beginnt sie, sobald der Dokumentensatz 10 % neue Dokumente erhält. Wenn sich beispielsweise 95 Dokumente im Dokumentensatz befinden, startet eine neue Lernsitzung, nachdem 10 neue Dokumente hinzugefügt wurden.
  • Wenn die letzte Lernsitzung erfolgreich war und der Skill aktualisiert wurde, startet eine neue Sitzung unter denselben Bedingungen wie die erste Sitzung.
  • Wenn die letzte Lernsitzung nicht erfolgreich war und der Skill nicht aktualisiert wurde, beginnt eine neue Lernsitzung, sobald der Dokumentensatz 5 % neue Dokumente erhält. Wenn sich beispielsweise 95 Dokumente im Dokumentensatz befinden, startet eine neue Lernsitzung, nachdem 5 neue Dokumente hinzugefügt wurden.

Schritt 3. Wie der Skill getestet wird

Das System aktualisiert den Skill, wenn Online Learning zu einer Erhöhung der Genauigkeit um mindestens 1 % führt. Das System testet die Genauigkeit des Skills wie folgt:
  • Wenn sich mindestens 20 Dokumente im Testdatensatz befinden, testet das System den Skill anhand des Testdatensatzes.
  • Wenn sich weniger als 20 Dokumente im Testdatensatz befinden:
    • Bei einem Document-Skill testet das System den Skill sowohl anhand des Trainingsdatensatzes als auch des Testdatensatzes.
    • Bei einem Klassifizierungs‑Skill testet das System den Skill sowohl anhand des Trainingsdatensatzes als auch des Testdatensatzes, wenn jede Klasse weniger als fünf Dokumente hat. Andernfalls verwendet das System Kreuzvalidierung, um die Genauigkeit zu bewerten.
Nach dem Testen sammelt das System weitere Dokumente und startet eine neue Lernsitzung.
Online Learning erstellt keine neue Version des Skills. Eine Versionsänderung erfolgt nur, wenn ein Skill veröffentlicht wird. Siehe Einen Skill veröffentlichen.

Online Learning aktivieren

Aktivieren Sie Online Learning für Document- und Klassifizierungs‑Skills

Training durch Manuelle Überprüfung

Helfen Sie dem System, aus Korrekturen der Operatoren während der Manuellen Überprüfung zu lernen

Einen Skill veröffentlichen

Stellen Sie eine neue Version eines Skills zur Nutzung bereit