跳转到主要内容

Field 参数

在训练过程中,标注字段中的每个单词都会被归属于神经网络中的某个特定类别。在新文档上搜索字段时(例如未参与训练的文档),神经网络会将新文档中的每个单词归属到一个或多个类别,并给出不同的置信度。然后利用神经网络的其他特性将已分类的单词组合成字段。可以使用下列参数来管理这些算法。
ParameterDescription
Void FieldName( String )在 Deep Learning 活动中训练的字段名称,格式为 “Group name.Field name”。
Void NetName( String )Deep Learning 活动的名称。
Void BreakOnSeparators( Logic )如果设置为 False,由垂直分隔符分隔的单词允许出现在假设中。如果设置为 True,由垂直分隔符分隔的单词将从假设中排除。默认值为 True
Void MinWordCount( Int )假设中允许的最小单词数。默认值为 1。
Void MaxWordCount( Int )假设中允许的最大单词数。默认值为 1。
Void UseBestWordClass( Logic )如果设置为 True,文档中的每个单词将被归属于与最佳匹配训练字段对应的神经网络类别。如果设置为 False,文档中的每个单词将被归属于所有置信度值大于或等于 MinWordClassConfidence 的类别。默认值为 False
Void StartFromBestWordClass( Logic )如果设置为 True,假设只会基于与第一个单词的最佳匹配字段对应的神经网络类别来生成。如果设置为 False,假设将基于第一个单词的所有类别来生成。默认值为 True
Void MinWordClassConfidence( Real )将某个单词视为字段一部分所需的最低置信度。默认值为 0.7。
Void MaxStartWordClassConfidence( Real )将某个单词视为字段一部分所允许的最高置信度。默认值为 1。单词属于某个字段的置信度必须低于该值。
Void ConfidentClassThreshold( Real )可靠置信度水平的阈值。默认值为 0.9。
Void MinLinkConfidence( Real )将单词组合成假设所需的最低置信度。默认值为 0.5。
Void MinAvgLinkConfidence( Real )使单词成为假设一部分所需的最低平均置信度。默认值为 0.5。
Void MinLinkConfidenceForUncertainWords( Real )即使未满足其 MinWordClassConfidence,也能使单词成为假设一部分所需的置信度。该单词的 ConfidentClassThreshold 值不得与任何其他类别相同。默认值为 0.95。

表格参数

ProductItemsRepeatableGroup

ParameterDescription
Void NetName( String )Deep Learning 活动的名称。
Void MinLineClassConfidence( Real )将一行视为表格行所需的最小行置信度。默认值为 0.5。
Void MinColumnCountInRow( Int )表格行中必须检测到的最少列数。默认值为 2。
Void CurrencyNames( StringArray )可能出现在数值旁边的货币名称。设置此 Parameter 以改进对包含金额列的检测。此 Parameter 在未来版本中将被弃用。
Void UnitsOfMeasure( StringArray )可能出现在商品数量旁边的计量单位。设置此 Parameter 以改进对包含金额列的检测。此 Parameter 在未来版本中将被弃用。

ProductItemsColumn

ParameterDescription
Void FieldName( String )由 Deep Learning 活动训练的字段名称。
Void MinClassConfidence( Real )将某个词视为属于该列所需的最低置信度级别。它可以是从 0 到 1 的小数。默认值为 0.2。
Void IsDecimal( Logic )表示该列是否由十进制数字组成。默认值为 False
Void IsDescription( Logic )表示该列是否包含描述,且不适合用于将表格划分为行。默认值为 False
Void IsMultiline( Logic )表示该列是否包含多行单元格。默认值为 False
Void IsUnfixed( Logic )表示该列在表格中的位置是否不固定。默认值为 False
Void DivideRowsByColumn( Logic )表示是否使用该列将表格划分为行。默认值为 True