跳转到主要内容
此对象允许您调整识别参数。版面中的每个文本块和表格单元格都具有各自的 RecognizerParams 类型子对象。此外,此对象还会作为 PageProcessingParams 对象的子对象,传递给 ABBYY FineReader Engine 的版面分析和识别函数。识别函数使用文本块和表格单元格中 RecognizerParams 类型子对象定义的识别参数。 每当在版面分析期间创建文本块或表格单元格时,其 RecognizerParams 类型子对象的属性都会使用传递给分析函数的 RecognizedParams 对象的属性值进行初始化。使用 LayoutBlocks 对象的 AddNew 方法创建的块,其子对象属性会被设置为合理的默认值。要了解某个属性的默认值,请参阅其说明。 RecognizerParams 对象是一个持久对象。这意味着对象的当前状态可以写入持久存储。之后,可以通过从持久存储中读取对象状态来重新创建该对象。以下方法可用于持久化该对象: Linux: SaveToFileLoadFromFile Windows SaveToFileLoadFromFileSaveToMemoryLoadFromMemory

属性

,只读

返回 Engine 对象。

指定识别时使用的语言。可通过方法轻松设置此属性。

此属性返回一个常量对象。要更改识别语言,你必须先使用相应的创建方法获取一个中间 TextLanguage 对象,修改所需参数,然后将得到的对象赋给该属性。

默认情况下,此参数初始化为英语。

控制自动语言检测。

启用语言自动检测后,系统会为文本中的每个单词检测识别语言。检测范围由 TextLanguage 属性中指定的语言列表决定。自动检测适用于识别语言未知的文档。

语言自动检测仅适用于预定义语言 (完整列表请参见ABBYY FineReader Engine 中的预定义语言).

如果你确信文档中包含你指定的所有语言,则自动检测没有意义。可将此属性设置为 TSPV_No 以关闭自动检测。

你可以通过 DetectedLanguages 属性查看已识别文档或已识别页面中检测到的语言列表,该属性属于orobject.

默认情况下,此属性值为 TSPV_Auto。

此属性的值是枚举常量按位 OR 的组合,这些常量表示可用于识别的文本类型。例如,如果将其设置为 TT_Normal | TT_Index,ABBYY FineReader Engine 将假定文本仅包含普通印刷体文本和以邮政编码样式书写的数字,并忽略所有其他类型。另请参见使用文本类型自动检测.

注意:

  • 如果此属性等于 TT_Matrix、TT_Typewriter、TT_OCR_A 和 TT_OCR_B 的任意组合,则无论 ProhibitItalic ProhibitSubscript ProhibitSuperscript 属性的值为何,斜体以及上标/下标都不会被识别。
  • 如果此属性为 TT_Handwritten,则无法校正图像方向。
  • 在 Windows 中:
    • 如果此属性设置为 TT_Handwritten 或 TT_Index,则 TrainUserPatterns 属性不能设置为 TRUE。
    • 如果 TrainUserPatterns 属性设置为 TRUE,则 TextTypes 属性只能包含一种文本类型。

默认情况下,此属性设置为 TT_Normal。

表示应分别为每个文本块确定文本类型。当文本块较小且文本类型各不相同时,此设置很有用,但可能会略微降低处理速度。

此属性的默认值为 FALSE。

指定要应用于目标文档的识别模式。每种模式都提供不同的识别速度和准确率级别,以便在具有各种特征的图像和文档上获得理想的结果。

默认情况下,此属性设置为 RM_Normal。

准确模式始终使用内置模式。若要禁用内置模式,请切换到普通模式 (RM_Normal) 。

指定是否识别低分辨率图像中的文本。此属性在识别传真、小字号印刷文本、低分辨率图像或印刷质量较差的图像时非常有用。

默认情况下,此属性的值为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 假定当前 RecognizerParams 对象所属块中的文本最多只包含一行。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 假定任何文本行都不包含多个单词,因此每一行文本都会作为单个单词进行识别。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别以斜体字体印刷的字母。当识别预计不含斜体字母的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在斜体字母,而此属性为 TRUE,则这些字母将被错误识别。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别下标字母。当识别预计不含下标的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在下标字母,而此属性为 TRUE,则这些字母将被错误识别。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别上标字母。当识别预计不含上标的文本时,此属性很有用,因为它可能会加快识别速度。如果图像中存在上标字母,而此属性为 TRUE,则这些字母将被错误识别。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会禁止识别跨行断字。当识别预计不含断字的文本时,此属性很有用,因为它可能会加快识别速度。如果已识别的块中存在断字,而此属性为 TRUE,则这些断字词将被错误识别。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 会指示 ABBYY FineReader Engine 不识别小型大写字母。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 时,ABBYY FineReader Engine 将假定一个块中的文本不会延续到下一个块。

默认情况下,此属性为 FALSE。

此属性指定字母大小写的识别模式。

默认情况下,此属性的值为 CRM_AutoCase,对应自动大小写识别。

此属性指定字母周围的标记类型 (例如下划线、边框、方框等) 。

对于每个字母位于独立单元格中的标记类型,请使用 CellsCount 属性设置已识别块的字符单元格数量。

默认情况下,此属性的值为 FMT_SimpleText,表示无标记。

指定块中字符单元格的数量。

此属性仅对字段标记类型 (FieldMarkingType 属性) 有意义,即每个字母写在独立单元格中的情况。

此属性的默认值为 1,但应设置适当的值以确保文本被正确识别。

仅限 Windows。

此属性指定是否在识别过程中训练用户模式。识别期间将显示模式训练对话框。

要确保模式训练过程正常运行,需要执行以下操作:

  • 设置父窗口 HWND 句柄的值 (属性)
  • UserPatternsFile 属性中指定用户模式文件

另请参阅Recognizing with Training

如果此属性设置为 TRUE:

  • TextTypes 属性只能包含一种文本类型,且该文本类型不能为 TT_Handwritten 或 TT_Index
  • PagePreprocessingParams 对象的属性不能设置为 TRUE
模式训练不支持中文、日文和韩文。

默认情况下,此属性为 FALSE。

将此属性设置为 TRUE 时,ABBYY FineReader Engine 将使用其内置模式进行识别。模式是建立字符图像与字符本身之间映射关系的文件。如果不希望使用标准 ABBYY FineReader Engine 模式进行字符识别,而只使用用户模式,可将此属性设置为 FALSE。这在识别使用装饰性或非标准字体输入的文本时可能很有用。在这种情况下,建议不使用 ABBYY FineReader Engine 内置模式,而改用针对这些字体训练的自定义用户模式。

用户自定义模式文件的路径存储在 UserPatternsFile 属性中。如果 UserPatternsFile 属性为空,则 UseBuiltInPatterns 属性将被忽略。对于 Windows,另请参阅Recognizing with Training

默认情况下,此属性为 TRUE。

在使用普通和快速识别模式时,可将此属性设置为 FALSE。精确模式下无法禁止使用内置模式 (请参阅Mode属性的说明) 。

包含用于识别的用户模式文件的完整路径。如果此属性的值不为空,识别过程中将使用用户模式文件中的信息。

如果 UseBuiltInPatterns 属性为 FALSE (即识别过程中不使用标准 ABBYY FineReader Engine 模式) ,则此属性应包含用户自定义模式文件的路径,因为届时仅使用该文件中存储的信息。对于 Windows,另请参阅使用训练进行识别

默认情况下,此属性存储空字符串。

在 ABBYY FineReader Engine 10 或更早版本中创建的用户模式文件无法在 FineReader Engine 12 Release 6 或更高版本中打开。若要继续使用这些文件,请将旧版用户模式文件另存为新格式:
  • 使用 FineReader Engine 11 或 FineReader Engine 12 Release 5 及更早版本。
  • 调用方法 (属于对象) ,传入包含旧模式文件名称及新文件完整路径的 string 集合。

指定是否将无法确定识别结果的字符的 IsSuspicious 属性设置为 TRUE。

该属性名称源于 ABBYY FineReader 会以背景色高亮显示文本中的可疑字符,从而便于操作员进行人工核验。

默认情况下,此属性为 TRUE。

此属性已弃用,将在未来版本中移除。

指定是否保存精确的字符区域 () 。

默认值为 FALSE。

指定是否保存字符识别的候选结果。

ICharParams::CharacterRecognitionVariants属性返回指定字符的识别候选结果集合。另请参阅使用 Voting API

默认值为 FALSE。

指定是否保存单词识别的候选结果。

IParagraph::GetWordRecognitionVariants方法和ICharParams::WordRecognitionVariants属性返回指定单词的识别候选结果集合。另请参阅使用 Voting API

默认值为 FALSE。

方法

名称说明
CopyFrom使用另一个对象的同名属性值初始化当前对象的属性。
LoadFromFile从磁盘文件中恢复对象内容。
LoadFromMemory <Note> 仅适用于 Windows。 </Note>从全局内存中恢复对象内容。
SaveToFile将对象内容保存到磁盘文件中。
SaveToMemory <Note> 仅适用于 Windows。 </Note>将对象内容保存到全局内存中。
SetPredefinedTextLanguage将识别语言设置为预定义的 ABBYY FineReader Engine 语言之一。
RecognizerParams 对象图

输出参数

此对象是 Engine 对象的 CreateRecognizerParams 方法的输出参数。

输入参数

此对象作为输入参数传递给以下对象的方法:

示例

FREngine.IEngine engine;
string fileName;
// 在识别期间训练用户模式
FREngine.IDocumentProcessingParams processingParams = Engine.CreateDocumentProcessingParams();
FREngine.IRecognizerParams recognizerParams = processingParams.PageProcessingParams.RecognizerParams;
Engine.CreateEmptyUserPattern( fileName );
Engine.MultiProcessingParams.MultiProcessingMode = FREngine.MultiProcessingModeEnum.MPM_Sequential;
recognizerParams.UserPatternsFile = fileName;
recognizerParams.TrainUserPatterns = true;
Document.Process(processingParams);
以下代码示例使用了该对象:

另请参阅

调整预处理、分析、识别和合成参数 识别手写文字 PageProcessingParams TextBlock 使用属性