Zum Hauptinhalt springen
Die Registerkarte Results im Skill Designer für Document-Skills enthält Statistiken zur Feldextraktion. Die Analyse dieser Statistiken zeigt, wie sich die Qualität der extrahierten Daten verbessern lässt. Alle vom Skill extrahierten Felder werden in der Spalte Fields angezeigt. Felder, die zu Feldgruppen gehören, sind in eingeklappte Dropdown-Listen zusammengefasst, die nach ihren Feldgruppen benannt sind. Document Skill Results Folgende Statistiken zur Feldextraktion sind verfügbar:
  • Die Spalte Accuracy zeigt den Prozentsatz der Felder mit korrekt extrahierten Werten (Zeile ALL FIELDS) sowie den Prozentsatz korrekt extrahierter Werte für einzelne Felder.
    • Genauigkeitswerte für einzelne Felder werden wie folgt berechnet: Accuracy = Correct / (Correct + Recognition Issue + Located Incorrectly + Not Detected).
    • Der ALL FIELDS-Genauigkeitswert wird mit derselben Formel berechnet, jedoch sind die Zahlen im Nenner über alle Felder aggregiert.
  • Die Spalte Correct zeigt die Anzahl der Feldinstanzen, deren extrahierter Wert dem Referenzwert entspricht.
  • Die Spalte Recognition Issue zeigt die Anzahl der Feldinstanzen, die im Dokument erkannt, aber nicht korrekt erkannt wurden.
  • Die Spalte Located Incorrectly zeigt die Anzahl der Feldinstanzen, deren Werte von den vorhergesagten Werten abweichen, weil ihre Bereiche an anderen Positionen erkannt wurden als in der Beschriftung festgelegt.
  • Die Spalte Not Detected zeigt die Anzahl der nicht erkannten Feldinstanzen.
  • Die Spalte Frequency in Documents zeigt den Prozentsatz der Dokumente, die das jeweilige Feld enthalten.
Hinweis: Standardmäßig werden diese Statistiken für alle Felder angezeigt. Sie können einzelne Felder in der Liste ausblenden und die Statistiken nur für die gewünschten Felder anzeigen. Klicken Sie dazu oben in der Spalte Fields auf das Filtersymbol und wählen Sie die gewünschten Felder aus.

Überprüfen von fehlerhaft extrahierten Feldern

Sie können Dokumente anzeigen, die Felder mit Fehlern enthalten. Klicken Sie dazu auf eine Statistik in der Spalte Recognition Issue, Located Incorrectly oder Not Detected. Beispiel: Wenn Sie auf die Statistik in der Spalte Recognition Issue für das Feld Order Date klicken, wird eine Registerkarte geöffnet, auf der Sie die Dokumente anzeigen können, in denen das Feld Order Date mit einem Erkennungsproblem extrahiert wurde. Auf der geöffneten Registerkarte Result Review können Sie die Extraktionsergebnisse, Fehler bei der Dokument‑Beschriftung und Erkennungsprobleme prüfen. Außerdem können Sie die beim Einrichten des Document-Skill erstellte Beschriftung mit der während des Trainings erstellten Beschriftung vergleichen. Dokumente können auf dieser Registerkarte in einem der folgenden Modi angezeigt werden:
  • Der Modus Reference zeigt die Referenz‑Beschriftung an, die beim Einrichten des Skill erstellt wurde (also vor dem Training), sowie die mit dieser Beschriftung extrahierten Feldwerte. Feldwerte und Bereiche können in diesem Modus bearbeitet werden.
  • Der Modus Predicted zeigt die beim Verarbeiten von Dokumenten erhaltenen Feldwerte und Bereiche an. Feldwerte und Bereiche können in diesem Modus nicht bearbeitet werden.
  • Der Modus Difference zeigt die Unterschiede zwischen der Referenz‑ und der vorhergesagten Beschriftung an. Identische Feldwerte und Bereiche werden grün angezeigt, abweichende Feldwerte und Bereiche rot. Feldwerte und Bereiche können in diesem Modus nicht bearbeitet werden.
Document Skill Differences Sie können zwischen diesen drei Modi wechseln, indem Sie auf der Symbolleiste auf die entsprechenden Registerkarten klicken. Wenn ein Feld beim Einrichten des Skill falsch beschriftet wurde und beim Verarbeiten eines Dokuments das korrekte Ergebnis erzielt wurde, können Sie die Referenz‑Beschriftung korrigieren. Wechseln Sie dazu in den Modus Difference und klicken Sie auf das Symbol über dem Wert des Felds mit dem Beschriftungsfehler: Recognition Issues Das Feld Field in Reference enthält den mit der Referenz‑Beschriftung extrahierten Wert. Klicken Sie auf Copy from Predicted, um den falschen Wert durch den beim Verarbeiten des Dokuments extrahierten Wert zu ersetzen.
Hinweis: Ein Erkennungsproblem bedeutet, dass ein oder mehrere Zeichen im Feldwert nicht korrekt erkannt wurden. Um einen solchen Fehler zu beheben, ändern Sie die Eigenschaften des Felds, damit solche Zeichen korrekt interpretiert werden.
Beispiel: Wenn ein Feld nur Zahlen enthalten darf, setzen Sie seinen Datentyp auf „Number“. Dadurch wird verhindert, dass beispielsweise die Zahl „1“ als „l“ (kleines L) oder „I“ (großes I) erkannt wird, die auf einem Dokument der „1“ sehr ähnlich sehen können. Wenn das Feld Field in Reference den korrekten Wert enthält, das Verarbeitungsergebnis jedoch nicht korrekt ist, empfehlen wir, die Anzahl der Dokumente im Datensatz zu erhöhen und das Skill neu zu trainieren. Um zum nächsten Dokument zu wechseln, das denselben Fehlertyp im selben Feld enthält, klicken Sie im Bereich Actions auf Go to Next Document.