RecognizerParams 类型子对象。此外,此对象还会作为 PageProcessingParams 对象的子对象,传递给 ABBYY FineReader Engine 的版面分析和识别函数。识别函数使用文本块和表格单元格中 RecognizerParams 类型子对象定义的识别参数。
每当在版面分析期间创建文本块或表格单元格时,其 RecognizerParams 类型子对象的属性都会使用传递给分析函数的 RecognizedParams 对象的属性值进行初始化。使用 LayoutBlocks 对象的 AddNew 方法创建的块,其子对象属性会被设置为合理的默认值。要了解某个属性的默认值,请参阅其说明。
RecognizerParams 对象是一个持久对象。这意味着对象的当前状态可以写入持久存储。之后,可以通过从持久存储中读取对象状态来重新创建该对象。以下方法可用于持久化该对象:
Linux: SaveToFile 和 LoadFromFile
Windows SaveToFile、LoadFromFile、SaveToMemory 和 LoadFromMemory。
属性
,只读 | 返回 Engine 对象。 | |
指定识别时使用的语言。可通过方法轻松设置此属性。 此属性返回一个常量对象。要更改识别语言,你必须先使用相应的创建方法获取一个中间 TextLanguage 对象,修改所需参数,然后将得到的对象赋给该属性。 默认情况下,此参数初始化为英语。 | ||
控制自动语言检测。 启用语言自动检测后,系统会为文本中的每个单词检测识别语言。检测范围由 TextLanguage 属性中指定的语言列表决定。自动检测适用于识别语言未知的文档。 如果你确信文档中包含你指定的所有语言,则自动检测没有意义。可将此属性设置为 TSPV_No 以关闭自动检测。 你可以通过 DetectedLanguages 属性查看已识别文档或已识别页面中检测到的语言列表,该属性属于orobject. 默认情况下,此属性值为 TSPV_Auto。 | ||
此属性的值是枚举常量按位 OR 的组合,这些常量表示可用于识别的文本类型。例如,如果将其设置为 TT_Normal | TT_Index,ABBYY FineReader Engine 将假定文本仅包含普通印刷体文本和以邮政编码样式书写的数字,并忽略所有其他类型。另请参见使用文本类型自动检测. 注意:
默认情况下,此属性设置为 TT_Normal。 | ||
表示应分别为每个文本块确定文本类型。当文本块较小且文本类型各不相同时,此设置很有用,但可能会略微降低处理速度。 此属性的默认值为 FALSE。 | ||
指定要应用于目标文档的识别模式。每种模式都提供不同的识别速度和准确率级别,以便在具有各种特征的图像和文档上获得理想的结果。 默认情况下,此属性设置为 RM_Normal。 | ||
指定是否识别低分辨率图像中的文本。此属性在识别传真、小字号印刷文本、低分辨率图像或印刷质量较差的图像时非常有用。 默认情况下,此属性的值为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 假定当前 RecognizerParams 对象所属块中的文本最多只包含一行。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 假定任何文本行都不包含多个单词,因此每一行文本都会作为单个单词进行识别。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别以斜体字体印刷的字母。当识别预计不含斜体字母的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在斜体字母,而此属性为 TRUE,则这些字母将被错误识别。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别下标字母。当识别预计不含下标的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在下标字母,而此属性为 TRUE,则这些字母将被错误识别。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别上标字母。当识别预计不含上标的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在上标字母,而此属性为 TRUE,则这些字母将被错误识别。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会禁止识别跨行断字。当识别预计不含断字的文本时,此属性很有用,因为它可能会加快识别速度。如果已识别的块中存在断字,而此属性为 TRUE,则这些断字词将被错误识别。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别小型大写字母。 默认情况下,此属性为 FALSE。 | ||
将此属性设置为 TRUE 时,ABBYY FineReader Engine 将假定一个块中的文本不会延续到下一个块。 默认情况下,此属性为 FALSE。 | ||
此属性指定字母大小写的识别模式。 默认情况下,此属性的值为 CRM_AutoCase,对应自动大小写识别。 | ||
此属性指定字母周围的标记类型 (例如下划线、边框、方框等) 。 对于每个字母位于独立单元格中的标记类型,请使用 CellsCount 属性设置已识别块的字符单元格数量。 默认情况下,此属性的值为 FMT_SimpleText,表示无标记。 | ||
指定块中字符单元格的数量。 此属性仅对字段标记类型 (FieldMarkingType 属性) 有意义,即每个字母写在独立单元格中的情况。 此属性的默认值为 1,但应设置适当的值以确保文本被正确识别。 | ||
仅限 Windows。 | 此属性指定是否在识别过程中训练用户模式。识别期间将显示模式训练对话框。 要确保模式训练过程正常运行,需要执行以下操作:
另请参阅Recognizing with Training。 如果此属性设置为 TRUE:
模式训练不支持中文、日文和韩文。 默认情况下,此属性为 FALSE。 | |
将此属性设置为 TRUE 时,ABBYY FineReader Engine 将使用其内置模式进行识别。模式是建立字符图像与字符本身之间映射关系的文件。如果不希望使用标准 ABBYY FineReader Engine 模式进行字符识别,而只使用用户模式,可将此属性设置为 FALSE。这在识别使用装饰性或非标准字体输入的文本时可能很有用。在这种情况下,建议不使用 ABBYY FineReader Engine 内置模式,而改用针对这些字体训练的自定义用户模式。 用户自定义模式文件的路径存储在 UserPatternsFile 属性中。如果 UserPatternsFile 属性为空,则 UseBuiltInPatterns 属性将被忽略。对于 Windows,另请参阅Recognizing with Training。 默认情况下,此属性为 TRUE。 | ||
包含用于识别的用户模式文件的完整路径。如果此属性的值不为空,识别过程中将使用用户模式文件中的信息。 如果 UseBuiltInPatterns 属性为 FALSE (即识别过程中不使用标准 ABBYY FineReader Engine 模式) ,则此属性应包含用户自定义模式文件的路径,因为届时仅使用该文件中存储的信息。对于 Windows,另请参阅使用训练进行识别。 默认情况下,此属性存储空字符串。
| ||
指定是否将无法确定识别结果的字符的 IsSuspicious 属性设置为 TRUE。 该属性名称源于 ABBYY FineReader 会以背景色高亮显示文本中的可疑字符,从而便于操作员进行人工核验。 默认情况下,此属性为 TRUE。 | ||
此属性已弃用,将在未来版本中移除。 | ||
指定是否保存精确的字符区域 () 。 默认值为 FALSE。 | ||
指定是否保存字符识别的候选结果。 默认值为 FALSE。 | ||
指定是否保存单词识别的候选结果。 IParagraph::GetWordRecognitionVariants方法和ICharParams::WordRecognitionVariants属性返回指定单词的识别候选结果集合。另请参阅使用 Voting API。 默认值为 FALSE。 | ||
方法
| 名称 | 说明 |
|---|---|
| CopyFrom | 使用另一个对象的同名属性值初始化当前对象的属性。 |
| LoadFromFile | 从磁盘文件中恢复对象内容。 |
| LoadFromMemory <Note> 仅适用于 Windows。 </Note> | 从全局内存中恢复对象内容。 |
| SaveToFile | 将对象内容保存到磁盘文件中。 |
| SaveToMemory <Note> 仅适用于 Windows。 </Note> | 将对象内容保存到全局内存中。 |
| SetPredefinedTextLanguage | 将识别语言设置为预定义的 ABBYY FineReader Engine 语言之一。 |
对象图
输出参数
输入参数
- FRDocument 对象的 Preprocess、PreprocessPages、Analyze 和 AnalyzePages 方法
- FRPage 对象的 Preprocess、Analyze、AnalyzeRegion、AnalyzeTable 和 IsEmpty 方法
示例
C# 代码
C# 代码
- Linux:CustomLanguage、CommandLineInterface
- Windows:CustomLanguage、CommandLineInterface;以及演示工具:BatchProcessingRecognition、Classification、MultiProcessingRecognition、PDFExportProfiles、User Pattern Training Utility
