跳轉到主要內容
「快速學習」活動用於從結構化與半結構化文件中擷取欄位。也可在文件於 Vantage 中處理時,同步訓練在此活動中選為輸出欄位的欄位。欲了解更多資訊,請參閱 Vantage Runtime Guide 中的線上學習 (Online Learning)。您可以在 活動屬性 (Activity Properties) 窗格中取消選取相關選項,以明確停用欄位訓練。如果您未將「快速學習」活動新增至文件處理流程中,一旦建立並發佈 skill 之後,就無法再對欄位進行訓練。 如果您正在編輯在 Vantage 中建立的 skill,該 skill 可能已包含預先訓練的「快速學習」活動。您可以新增其他活動,並將它們與這個預先訓練的活動加以組合使用。欲了解更多資訊,請參閱編輯在 Vantage 中建立並訓練的 skill
注意:「快速學習」活動無法擷取複雜結構(例如巢狀表格,即在其他表格中重複出現的結構)以及影像 (Image) 類型的欄位。若要擷取這類結構,請使用 Extraction Rules 活動

使用情境

在以下情況下,將此活動新增到您的文件處理流程中:
  • 當文件集包含多種文件版面配置變體,且您能在訓練期間為每種變體提供樣本時。例如,如果您想訓練從多家不同銀行的銀行對帳單中進行資料抽取,並且您手邊擁有來自各家銀行的樣本。
  • 當您計畫處理的文件版面變體尚未用來訓練您的 skill,但您希望利用 Online Learning 時。例如,在處理發票時,每個供應商很可能都有自己的發票版面,而且每天都可能出現新的供應商。在這種情況下,您會使用其他活動從文件中抽取資料,但也可以將 Fast Learning 活動加入處理流程中,它會在執行期間利用來自手動審核循環的 Online Learning 回饋進行訓練。
  • 當您希望在文件於 Vantage 中處理的同時同步訓練欄位時。

運作方式

Fast Learning 以叢集技術為基礎,會將版面配置相似的文件分組,並在內部為每個叢集訓練一個欄位擷取模型。Fast Learning 活動可以學習成千上萬種不同的文件變體。 與 Deep Learning 活動不同,Fast Learning 活動傾向於記住它「看過」的內容,而不是學習影像模式特徵。Fast Learning 無法對尚未遇到的新文件變體進行泛化。當 Fast Learning 活動在執行階段遇到新文件時,它會判斷該文件最相似的是哪個叢集,然後套用相應的內部模型。 此活動不需要大型訓練集——一份文件就足以開始訓練。如果您擁有同一文件的多個變體(例如在本質上相同但外觀略有差異的文件),我們建議在訓練集中納入代表每一種不同變體的文件。 如需更多資訊,請參閱設定 Fast Learning 活動