跳轉到主要內容
您可以使用單獨的文件集來訓練分段活動。為此,從技能名稱旁的下拉清單中選取分段活動。然後在 Upload 按鈕左側的下拉清單中,選取所需的文件集或按一下 Create Set… 來建立新的文件集。您可以在此索引標籤上依照文件章節中的說明,上傳、刪除和旋轉文件。 若要設定分段活動:
  1. Activities 索引標籤上,將分段活動新增到文件處理流程中。請注意,您的分段活動應該位於將從文字片段擷取欄位的活動之前。
  2. Activity Properties 窗格中,選取所有對應於要擷取之片段的欄位。
Note: 只支援欄位類型為 Text 且資料類型設定為 Text 的欄位。
  1. 按一下 Activity Editor。如有需要,可在 Fields 索引標籤上進一步修改文件標記。
  2. 按一下 Train Activity。訓練可以在 FastThorough 模式下執行。
    • 預設會選取 Fast 模式。此模式即使在小型文件集上也能運作,且活動訓練速度較快。
    • 如果您對在 Fast 模式下取得的結果不滿意,請考慮切換到 Thorough 模式,此模式會訓練深度學習 (Deep Learning) 模型。此模式需要訓練集中有更多文件,且訓練時間較長,但能在各種不同的文件上表現更佳。文件集中必須至少包含 50 份已標記的文件,但我們建議至少有 150 份已標記的文件。若要切換到 Thorough 模式,請使用 Train Activity 按鈕旁的下拉選單。
    • 您可以測試兩種模式,並選擇在您的文件上效果最佳的模式。
Note: Thorough 模式僅能用於英文文件。
  1. 活動訓練完成後,將自動開始進行活動測試。測試完成後,前往 Results 索引標籤並分析該活動的欄位擷取結果。Results 索引標籤中顯示的統計資料與 Results 索引標籤上顯示的該技能的一般統計資料相同。如有需要,對標記進行必要的調整,並再次訓練活動。
Note: 活動只能使用具有已確認標記的文件進行訓練與測試。如果參考標記是根據預測標記自動產生的,則文件具有未確認標記,除非您使用文件內容功能表中的相應選項,將預測標記複製到參考標記。您可以在 Documents 索引標籤上檢查每份文件的標記狀態。若要確認文件的標記,您應在 Fields 索引標籤上檢閱該文件。
支援語言:英文、俄文、德文、法文、西班牙文、義大利文、葡萄牙文(標準)、日文和荷蘭文。