快速學習活動 - ABBYY Documentation

使用情境
運作方式

「快速學習」活動用於從結構化與半結構化文件中擷取欄位。也可在文件於 Vantage 中處理時，同步訓練在此活動中選為輸出欄位的欄位。欲了解更多資訊，請參閱 Vantage Runtime Guide 中的線上學習 (Online Learning)。您可以在 活動屬性 (Activity Properties) 窗格中取消選取相關選項，以明確停用欄位訓練。如果您未將「快速學習」活動新增至文件處理流程中，一旦建立並發佈 skill 之後，就無法再對欄位進行訓練。如果您正在編輯在 Vantage 中建立的 skill，該 skill 可能已包含預先訓練的「快速學習」活動。您可以新增其他活動，並將它們與這個預先訓練的活動加以組合使用。欲了解更多資訊，請參閱編輯在 Vantage 中建立並訓練的 skill。

「快速學習」活動無法擷取複雜結構 (例如巢狀表格，即在其他表格中重複出現的結構) 以及影像 (Image) 類型的欄位。若要擷取這類結構，請使用 Extraction Rules 活動。

使用情境

在以下情況下，將此活動新增到您的文件處理流程中：

當文件集包含多種文件版面配置變體，且您能在訓練期間為每種變體提供樣本時。例如，如果您想訓練從多家不同銀行的銀行對帳單中進行資料抽取，並且您手邊擁有來自各家銀行的樣本。
當您計畫處理的文件版面變體尚未用來訓練您的 skill，但您希望利用 Online Learning 時。例如，在處理發票時，每個供應商很可能都有自己的發票版面，而且每天都可能出現新的供應商。在這種情況下，您會使用其他活動從文件中抽取資料，但也可以將 Fast Learning 活動加入處理流程中，它會在執行期間利用來自手動審核循環的 Online Learning 回饋進行訓練。
當您希望在文件於 Vantage 中處理的同時同步訓練欄位時。

運作方式

Fast Learning 以叢集技術為基礎，會將版面配置相似的文件分組，並在內部為每個叢集訓練一個欄位擷取模型。Fast Learning 活動可以學習成千上萬種不同的文件變體。與 Deep Learning 活動不同，Fast Learning 活動傾向於記住它「看過」的內容，而不是學習影像模式特徵。Fast Learning 無法對尚未遇到的新文件變體進行泛化。當 Fast Learning 活動在執行階段遇到新文件時，它會判斷該文件最相似的是哪個叢集，然後套用相應的內部模型。此活動不需要大型訓練集——一份文件就足以開始訓練。如果您擁有同一文件的多個變體 (例如在本質上相同但外觀略有差異的文件) ，我們建議在訓練集中納入代表每一種不同變體的文件。如需更多資訊，請參閱設定 Fast Learning 活動。

公司偵測的運作方式

設定 Fast Learning 活動

Advanced Designer

​使用情境

​運作方式

使用情境

運作方式