跳轉到主要內容
在 Document Skill Designer 中的 Results 頁籤包含文件 Skill 的欄位擷取統計資料。分析這些統計資料有助於了解如何改進擷取資料的品質。 由 skill 擷取的所有欄位都會顯示在 Fields 欄中。屬於欄位群組的欄位會彙整到以其欄位群組命名的摺疊式下拉清單中。 文件 Skill 結果 可用的欄位擷取統計資料如下:
  • Accuracy 欄會顯示具有正確擷取值的欄位百分比(ALL FIELDS 列),以及各個欄位正確擷取值的百分比。
    • 各個欄位的 Accuracy 值計算方式為:Accuracy = Correct / (Correct + Recognition Issue + Located Incorrectly + Not Detected)。
    • ALL FIELDS 的 Accuracy 值使用相同公式計算,但分母中的數值是跨所有欄位彙總的結果。
  • Correct 欄會顯示其擷取值與參考值相符的欄位實例數量。
  • Recognition Issue 欄會顯示在文件中偵測到但未正確辨識的欄位實例數量。
  • Located Incorrectly 欄會顯示其值與預測值不同的欄位實例數量,其原因是其區域偵測位置與標記中指定的位置不一致。
  • Not Detected 欄會顯示未偵測到的欄位實例數量。
  • Frequency in Documents 欄會顯示包含該欄位之文件的百分比。
提示: 預設情況下,這些統計資料會針對所有欄位顯示。您可以在清單中隱藏個別欄位,僅檢視所需欄位的統計資料。若要執行此操作,請按一下 Fields 欄頂端的篩選圖示,然後選取所需的欄位。

檢閱擷取錯誤的欄位

您可以檢視包含擷取錯誤欄位的文件。為此,請按一下 Recognition IssueLocated IncorrectlyNot Detected 欄中的統計值。 範例: 按一下 Order Date 欄位在 Recognition Issue 欄中的統計值,會開啟一個索引標籤,您可以在其中檢視 Order Date 欄位因辨識問題而擷取錯誤的文件。 在開啟的 Result Review 索引標籤中,您可以檢閱擷取結果、文件標記中的錯誤以及辨識問題。您也可以比較在設定 文件 Skill 時建立的標記與在訓練期間建立的標記。文件可在此索引標籤中以下列其中一種模式檢視:
  • Reference 模式會顯示在設定 skill(即訓練之前)時建立的參考標記,以及使用該標記擷取的欄位值。在此模式中可以編輯欄位值與區域。
  • Predicted 模式會顯示在處理文件時取得的欄位值與區域。在此模式中無法編輯欄位值與區域。
  • Difference 模式會顯示參考標記與預測標記之間的差異。相同的欄位值與區域會以綠色顯示,而不同的欄位值與區域會以紅色顯示。在此模式中無法編輯欄位值與區域。
Document Skill Differences 您可以按一下工具列上對應的索引標籤,在這三種模式之間切換。 如果在設定 skill 時欄位被錯誤標記,而在處理文件時取得了正確結果,您可以更正參考標記。為此,請切換到 Difference 模式,然後按一下位於包含標記錯誤之欄位值上方的圖示: Recognition Issues Field in Reference 方塊會包含使用參考標記擷取的值。按一下 Copy from Predicted,以處理文件時擷取的值取代不正確的值。
提示: 辨識問題表示欄位值中的一個或多個字元未被正確辨識。若要修正此類型錯誤,請修改欄位的屬性,使此類字元能被正確解讀。
範例: 如果某欄位只能包含數字,請將其資料類型設為 “Number”。這樣即可避免例如將數字 “1” 誤辨識為 “l”(小寫 L)或 “I”(大寫 I),而這兩者在文件上看起來都可能與 “1” 非常相似。 如果 Field in Reference 方塊中包含正確值,但處理結果不正確,建議增加資料集中的文件數量並重新訓練 skill。 若要前往下一份在相同欄位中包含同類型錯誤的文件,請在 Actions 窗格中按一下 Go to Next Document