從混合文件集(半結構化與非結構化)中擷取資料

建立文件 Skill 的步驟
- 開啟 Advanced Designer。在開始頁面按一下 Create Document Skill 來建立新的 Skill。
- 使用隨即開啟的 Documents 索引標籤,上傳將用於設定 Skill 的文件。為了確保文件集合足以用來設定分類器,請為每種變體新增大致相同數量的文件。
- 上傳影像後,前往 Fields 索引標籤,為此 Skill 設定欄位結構,方法是建立並設定將由 Skill 擷取的欄位。在 Reference 區段中標記文件。
- 前往 Activities 索引標籤,將 Classify 活動新增到文件處理流程中。
- 開啟 Activity Editor 並設定 Classify 活動。為此,請為每個變體建立對應的類別,將這些類別指派給您的文件,並訓練該活動。
- 返回 Activities 索引標籤,透過新增 IF 活動,以及用於處理每種文件變體的個別活動,為處理流程設定條件式分支。
- 設定並訓練您建立的活動。
- 按一下 Test Skill Using Selected Documents 測試您的 Skill,並分析取得的結果。
- 當測試結果足夠令人滿意時,發佈您的 Skill。
從半結構化文件的表格儲存格中擷取文字

建立文件 Skill 的步驟
- 開啟 Advanced Designer。在起始頁面按一下 Create Document Skill 來建立新的 skill。
- 使用開啟的 Documents 索引標籤,上傳用於設定 skill 的文件。
- 上傳影像後,前往 Fields 索引標籤,為該 skill 建立欄位結構,建立並設定將由 skill 擷取的欄位。在 Reference 區段中為文件加上標籤。
- 前往 Activities 索引標籤,建立 Fast Learning 活動,並指定此活動要擷取的欄位。
- 開啟 Activity Editor,設定並訓練 Fast Learning 活動。
- 回到 Activities 索引標籤,建立 Named Entities (NER) 活動,並指定來源欄位,以及用於儲存擷取之命名實體的欄位。將命名實體對應到選定的欄位。
- 如果您有包含地址的欄位,且希望將地址拆分為各個組成部分,請建立 Address Parsing 活動,並指定來源欄位,以及用於儲存擷取之地址組成部分的欄位。將地址組成部分對應到選定的欄位。
- 按一下 Test Skill Using Selected Documents 來測試您的 skill,並分析結果。
- 當測試結果令人滿意時,發佈您的 skill。

建立文件 Skill 的步驟
- 開啟 Advanced Designer。在開始頁面上按一下 Create Document Skill 來建立新的 skill。
- 在隨即開啟的 Documents 分頁中,上傳將用於設定 skill 的文件。
- 上傳影像後,前往 Fields 分頁,為 skill 建立並設定將由 skill 擷取的欄位結構。在 Reference 區段中標記文件。
- 前往 Activities 分頁,建立一個 Segmentation 活動,並指定用於儲存純文字段落的欄位。
- 開啟 Activity Editor,設定並訓練 Segmentation 活動。
- 返回 Activities 分頁,建立一個 Extraction Rules 活動,並指定用於儲存文件中半結構化片段資料的欄位。
- 開啟 Activity Editor,設定並測試 Extraction Rules 活動。
- 按一下 Test Skill Using Selected Documents 測試你的 skill,並分析取得的結果。
- 當測試結果令人滿意時,發佈你的 skill。
