跳轉到主要內容
注意: 您可以使用獨立的文件集來訓練 Deep Learning 活動。若要這麼做,請從技能名稱右側的下拉清單中選擇 Deep Learning 活動。然後,在 Upload 按鈕左側的下拉清單中,選擇所需的文件集,或按一下 Create Set… 以建立新的文件集。您可以在此索引標籤中上傳、刪除和旋轉文件,如文件一節所述。

設定步驟

若要設定 Deep Learning 活動:

步驟 1. 新增 Activity

Activities 索引標籤中,將一個用於半結構化文件的 Deep Learning Activity 新增到您的文件處理流程中。

步驟 2:選擇欄位

Activity Properties 窗格中,選擇要使用此活動進行訓練的欄位。 您可以從以下選項中選擇:
  • 最多 50 個類型為 Text 的欄位,不論其巢狀層級為何。
  • 一個最多包含 32 個欄位的表格。
如果您需要訓練更多欄位,可以新增更多 Deep Learning 活動,並使用這些活動來選擇額外的欄位。舉例來說,如果您需要同時訓練多個文字欄位以及一個表格,請建立兩個 Deep Learning 活動。
注意: 無法訓練下列欄位:
  • 類型不是 Text 的欄位
  • 包含多個項目的群組、表格,或巢狀在包含多個項目之群組中的多項文字欄位
  • 含有超過 32 個欄位的表格
您需要使用其他活動來設定此類欄位的擷取,例如 Extraction Rules 活動。

步驟 3:標記文件

按一下 Activity Editor,然後前往 Fields 分頁來標記文件。Activity Editor 中的標記流程與一般的文件標記流程相同。 以下準則可協助您決定文件集的大小:
  • 如果訓練集僅包含最低要求的 10 份文件,您可以開始深度學習訓練,但建議再上傳更多文件以獲得更高的準確度。
  • 如果您的訓練集只包含 10 份文件,您仍然可以開始訓練模型。然而,Advanced Designer 會顯示警告,建議您新增超過 500 份已標記文件,以獲得最佳訓練結果。
  • 如果您的訓練集包含 500 到 10,000 份文件,您可以立即開始訓練活動。這是訓練集中建議使用的文件數量。
  • 如果訓練集包含超過 10,000 份文件,Advanced Designer 會顯示警告,指出該技能的表現可能會變得不穩定。

步驟 4. 訓練 Activity

完成上傳並標記文件後,按一下 Train Activity

步驟 5. 監控訓練進度

前往 Results 索引標籤以評估訓練進度。如有必要,調整訓練時長或停止訓練。 如需更多資訊,請參閱監控與調整活動訓練

訓練後步驟

活動訓練完成後,將會自動開始活動測試。若您停止訓練,系統會提示您手動開始測試該活動。 測試完成後,請在 Results 分頁的 Activity Test Results 區段中分析欄位擷取結果。此活動的統計資料與 Results 分頁上顯示的該技能一般統計資料相同。若您對欄位擷取品質不滿意,可以採取下列措施:
  • 向訓練集新增更多文件並繼續訓練流程。到目前為止取得的訓練結果將會被保留,而類神經網路會使用更新後的文件集進行額外訓練。
  • 調整標註並重新啟動訓練。到目前為止取得的訓練結果將會被捨棄,類神經網路將從頭開始訓練。
  • 建立具有 Extraction Rules 活動的 Hypothesis Filtering 容器,以便您為 Deep Learning 活動的輸出設定條件。
活動只能使用具有已確認標註的文件進行訓練和測試。如果參考標註是根據預測標註自動產生的,且您未在文件內容功能表中使用相應選項將預測標註複製到參考標註,則該文件的標註為未確認狀態。您可以在 Documents 分頁檢查每個文件的標註狀態。若要確認某個文件的標註,您應在 Fields 分頁中檢閱該文件。
注意: 自 Advanced Designer v. 2.3.1 起,Deep Learning 活動的欄位限制已變更。若您的技能使用的已訓練 Deep Learning 活動可擷取超過 50 個欄位,您仍可繼續使用該技能處理文件。不過,當您開啟此類技能進行編輯時,現有的 Deep Learning 活動將會被拆分為多個 Deep Learning 活動,而您可能需要重新訓練它們。您也必須在文件處理工作流程中為這些活動設定路由。