Überprüfen Sie auf der Registerkarte Ergebnis die Klassifizierungsgenauigkeit pro Klasse und beheben Sie häufige Probleme im Trainingsdatensatz, die zu Fehlklassifizierungen führen.
Use this file to discover all available pages before exploring further.
Nach dem Training eines Klassifizierungs‑Skills öffnen Sie im Classification Skill Designer die Registerkarte Ergebnis, um zu sehen, wie genau der Klassifikator die einzelnen Klassen zuordnet, und um Fehler im Trainingsdatensatz zu diagnostizieren. Die Statistiken werden automatisch aktualisiert, sobald der Klassifikator trainiert wurde. Wenn die Genauigkeit niedrig ist, springen Sie zu Klassifizierungsfehler, um mehr über häufige Ursachen und deren Behebung zu erfahren.
Die Ergebnistabelle enthält alle nicht leeren benutzerdefinierten Klassen (außer Keine Klasse). Die Klassen werden zunächst nach Genauigkeit (von der niedrigsten zur höchsten), dann nach der Anzahl der Dokumente und schließlich alphabetisch nach Namen sortiert. Eine Bildlaufleiste wird angezeigt, wenn nicht alle Zeilen auf den Bildschirm passen.Wenn Sie auf eine Zeile klicken, wird die entsprechende Klasse auf der Registerkarte documents geöffnet. Wenn Sie eine Klasse auf der Registerkarte documents umbenennen, wird der Name auf der Registerkarte Ergebnis automatisch aktualisiert. Wenn Sie eine Klasse nach dem Training löschen, wird ihr Name auf der Registerkarte Ergebnis ausgegraut angezeigt; die Zeile wird erst beim nächsten Training des Klassifikators entfernt.
Für einen Klassifizierungs‑Skill gibt es keinen festen Genauigkeitsschwellenwert — das richtige Ziel hängt davon ab, wie viele fehlgeleitete Dokumente in nachgelagerten Prozessen tolerierbar sind und wie viel Manuelle Überprüfung akzeptabel ist. Als praktische Orientierung gilt: Streben Sie eine hohe Genauigkeit pro Klasse an (nicht nur insgesamt), arbeiten Sie weiter an den unten genannten Ursachen, solange sich die Lücke schließt, und hören Sie auf, sobald eine Klasse entweder Ihre geschäftlichen Anforderungen erfüllt oder trotz ausgewogener, sauberer Trainingsdaten erkennbar ein Plateau erreicht hat. Wenn eine Klasse deutlich unter dem Niveau der anderen stagniert, behandeln Sie sie als nicht unterscheidbar und fassen Sie sie mit der ähnlichsten benachbarten Klasse zusammen.Sobald der Skill produktiv eingesetzt wird, verfolgen Sie Genauigkeit des Dokumentklassifikators weiterhin im Zeitverlauf im Analytics Dashboard und ziehen Sie Online Learning zur kontinuierlichen Verbesserung in Betracht.
Die meisten Fälle fehlerhafter Klassifizierung entstehen durch Fehler im Trainingsdatensatz — zum Beispiel durch falsch zugewiesene Referenzklassen oder eine unzureichende Anzahl von Dokumenten für eine bestimmte Klasse.
Eine unzureichende Klassifizierungsqualität kann durch Folgendes verursacht werden:
Eine unzureichende Anzahl hochgeladener Dokumente
Eine deutlich unausgewogene Verteilung der Dokumente auf die Klassen
Eine unzureichende Anzahl von Beispielen der häufigsten Dokumentvarianten für die jeweilige Klasse
Verbessern Sie die Klassifizierungsqualität, indem Sie die fehlenden Dokumente zum Trainingsdatensatz hinzufügen. Streben Sie für jede Klasse 100 bis 1000 Dokumente an. Außerdem sollte Ihr Dokumentensatz Beispieldokumente für die häufigsten Dokumentvarianten jeder Klasse in etwa im Verhältnis 1:1 enthalten.Nachdem Sie die neuen Dokumente zum Trainingsdatensatz hinzugefügt haben, ordnen Sie jedem eine Klasse zu und trainieren den Klassifikator neu.
Wenn zwei Klassen immer wieder verwechselt werden, weil sie sich in Form, Layout oder Text nicht wesentlich unterscheiden, führen Sie sie zu einer einzigen Klasse zusammen. Trennen Sie die Dokumente später in der Pipeline anhand extrahierter Feldwerte, falls die Unterscheidung weiterhin wichtig ist.
Zum Beispiel werden eine Klasse für Rechnungen unter 10.000 undeineKlassefu¨rRechnungenu¨ber10.000 wahrscheinlich verwechselt, da der einzige Unterschied zwischen ihnen der Gesamtbetrag ist. Führen Sie sie in einer einzigen
Invoice-Klasse zusammen und verzweigen Sie nachgelagert anhand des Betrags — nachdem der Gesamtbetrag extrahiert wurde.