跳轉到主要內容

Field 參數

在訓練過程中,已標記欄位中的每個單字都會被歸屬到神經網路中的特定類別。當在新的文件上搜尋欄位(例如未用於訓練的文件)時,神經網路會將新文件中的每個單字歸屬到一個或多個類別,且具有不同程度的置信度。接著會使用額外的神經網路功能,將已分類的單字組合成欄位。可以使用下列參數來管理這些演算法。
ParameterDescription
Void FieldName( String )在 Deep Learning 活動中訓練的欄位名稱,格式為「Group name.Field name」。
Void NetName( String )Deep Learning 活動的名稱。
Void BreakOnSeparators( Logic )若設為 False,由垂直分隔符分隔的單字可以出現在假設中。若設為 True,由垂直分隔符分隔的單字會從假設中排除。預設值為 True
Void MinWordCount( Int )假設中允許的最少單字數。預設值為 1。
Void MaxWordCount( Int )假設中允許的最多單字數。預設值為 1。
Void UseBestWordClass( Logic )若設為 True,文件中的每個單字都會被歸屬到與最佳匹配受訓欄位對應的神經網路類別。若設為 False,文件中的每個單字都會被歸屬到所有置信度大於或等於 MinWordClassConfidence 的類別。預設值為 False
Void StartFromBestWordClass( Logic )若設為 True,只會根據與第一個單字之最佳匹配欄位對應的神經網路類別來產生假設。若設為 False,則會根據第一個單字的所有類別來產生假設。預設值為 True
Void MinWordClassConfidence( Real )將單字視為欄位一部分所需的最低置信度。預設值為 0.7。
Void MaxStartWordClassConfidence( Real )將單字視為欄位一部分所允許的最高置信度。預設值為 1。單字屬於某欄位的置信度必須低於此值。
Void ConfidentClassThreshold( Real )可靠置信度的閾值。預設值為 0.9。
Void MinLinkConfidence( Real )將單字組合成一個假設所需的最低置信度。預設值為 0.5。
Void MinAvgLinkConfidence( Real )使單字成為假設一部分所需的最低平均置信度。預設值為 0.5。
Void MinLinkConfidenceForUncertainWords( Real )即使未達到 MinWordClassConfidence,仍可使單字成為假設一部分所需的置信度。該單字的 ConfidentClassThreshold 值不得與任何其他類別相同。預設值為 0.95。

表格參數

ProductItemsRepeatableGroup

ParameterDescription
Void NetName( String )深度學習活動的名稱。
Void MinLineClassConfidence( Real )一行要被視為表格列所需的最低行置信度。預設值為 0.5。
Void MinColumnCountInRow( Int )必須在一個表格列中找到的最少欄數。預設值為 2。
Void CurrencyNames( StringArray )可能出現在數字旁邊的貨幣名稱。指定此 Parameter 以改善對包含金額欄位的偵測。此 Parameter 將在未來版本中被棄用。
Void UnitsOfMeasure( StringArray )可能出現在商品數量旁邊的計量單位。設定此 Parameter 以改善對包含金額欄位的偵測。此 Parameter 將在未來版本中被棄用。

ProductItemsColumn

ParameterDescription
Void FieldName( String )由 Deep Learning 活動訓練的欄位名稱。
Void MinClassConfidence( Real )將字詞視為屬於該欄所需的最低信心度。可以是從 0 到 1 的小數數值。預設值為 0.2。
Void IsDecimal( Logic )指示該欄是否由十進位數值組成。預設值為 False
Void IsDescription( Logic )指示該欄是否包含說明文字,且不適合用來將表格分割為多列。預設值為 False
Void IsMultiline( Logic )指示該欄是否包含多行儲存格。預設值為 False
Void IsUnfixed( Logic )指示該欄在表格中的位置是否不固定。預設值為 False
Void DivideRowsByColumn( Logic )指示是否使用該欄將表格劃分為多列。預設值為 True