跳转到主要内容

字段参数

在训练过程中,标注字段中的每个词都会被归入神经网络中的特定类别。在新文档上查找字段时(例如未参与训练的文档),神经网络会将新文档中的每个词归入一个或多个类别,并给出不同的置信度。随后会利用额外的神经网络特性将已分类的词组合成字段。可使用下列参数来控制这些算法。
ParameterDescription
Void FieldName( String )在 Deep Learning 活动中训练的字段名称,格式为“Group name.Field name”。
Void NetName( String )Deep Learning 活动的名称。
Void BreakOnSeparators( Logic )设为 False 时,允许被竖直分隔符隔开的词出现在假设中;设为 True 时,被竖直分隔符隔开的词将从假设中排除。默认值为 True
Void MinWordCount( Int )假设中允许的最少词数。默认值为 1。
Void MaxWordCount( Int )假设中允许的最多词数。默认值为 1。
Void UseBestWordClass( Logic )设为 True 时,文档中的每个词将被归入与其最契合的已训练字段对应的神经网络类别;设为 False 时,文档中的每个词将被归入所有置信度大于或等于 MinWordClassConfidence 的类别。默认值为 False
Void StartFromBestWordClass( Logic )设为 True 时,仅基于与第一个词最契合字段对应的神经网络类别生成假设;设为 False 时,将基于第一个词的所有类别生成假设。默认值为 True
Void MinWordClassConfidence( Real )将某个词视为字段组成部分所需的最低置信度。默认值为 0.7。
Void MaxStartWordClassConfidence( Real )将某个词视为字段起始词所属类别的最高置信度上限。默认值为 1。词归属于某字段的置信度必须低于该值。
Void ConfidentClassThreshold( Real )可靠置信度阈值。默认值为 0.9。
Void MinLinkConfidence( Real )将词连接并组合成一个假设所需的最低置信度。默认值为 0.5。
Void MinAvgLinkConfidence( Real )使某个词成为假设一部分所需的最低平均连接置信度。默认值为 0.5。
Void MinLinkConfidenceForUncertainWords( Real )即使未达到其 MinWordClassConfidence,也能使某个词纳入假设所需的置信度。该词的 ConfidentClassThreshold 值不得与任何其他类别相同。默认值为 0.95。

表格 Parameter

ProductItemsRepeatableGroup

ParameterDescription
Void NetName( String )深度学习活动的名称。
Void MinLineClassConfidence( Real )将一行视为表格行所需的最低行置信度。默认值为 0.5。
Void MinColumnCountInRow( Int )表格行中必须包含的最少列数。默认值为 2。
Void CurrencyNames( StringArray )可能出现在数字旁边的币种名称。指定此 Parameter 以提升对包含金额列的检测效果。此 Parameter 将在未来版本中弃用。
Void UnitsOfMeasure( StringArray )可能出现在商品数量旁边的计量单位。设置此 Parameter 以提升对包含金额列的检测效果。此 Parameter 将在未来版本中弃用。

ProductItemsColumn

ParameterDescription
Void FieldName( String )由 Deep Learning 活动训练的字段名称。
Void MinClassConfidence( Real )将词视为属于该列所需的最低置信度。取值为 0 到 1 的小数。默认值为 0.2。
Void IsDecimal( Logic )指示该列是否由十进制数构成。默认值为 False
Void IsDescription( Logic )指示该列是否包含描述文本,且不适合用于将表格划分为行。默认值为 False
Void IsMultiline( Logic )指示该列是否包含多行单元格。默认值为 False
Void IsUnfixed( Logic )指示该列在表中的位置是否不固定。默认值为 False
Void DivideRowsByColumn( Logic )指示是否使用该列将表格划分为行。默认值为 True