跳转到主要内容
本主题适用于 Windows 版 FRE,但不需要 Visual Components。
如果 IRecognizerParams::TrainUserPatterns 属性设置为 TRUE,则会在识别过程中启用训练用户模式。每当遇到未知字符时,都会打开 Pattern Training 对话框,并在其中显示该字符图像。 PatternTrainingDialog
您还可以使用 IEngine::TrainUserPattern 方法,在不显示对话框的情况下执行模式训练。此方法的输入参数包括 TrainingImagesCollection 对象 (用于存储字符图像集合) 以及字符本身。

训练识别字符

上方对话框窗口中的框必须只圈定一个字符,并且该字符必须完全包含在框内。如果框只圈定了字符的一部分,或圈定了多个字符,请单击框的边框并移动它们,使其满足上述要求。MoveBodyLeftMoveBodyRight 按钮也可用于移动框的边框 (这对训练斜体符号特别有用) 。正确定位框后,输入该字符并单击 Train 按钮。
  • 您只能训练系统识别字母表中包含的字符。如果您希望训练 ABBYY FineReader Engine 识别无法通过键盘输入的字符,请使用两个字符的组合来表示这些不存在的字符,或从 Character Table 中复制所需字符 (在 Pattern Training 对话框中单击 DotButton 按钮以打开 Character Table) 。
  • 如果您希望训练系统保留字符格式,请在单击 Train 按钮前,在 Pattern Training 对话框中选择相应的 Italic 或 Bold 项。
  • 训练大写/小写字符图像时,请确保分别只输入大写/小写字符。
如果您在训练过程中出错,请单击 Back 按钮,将框恢复到之前的位置。最后输入的“图像 — 字符”对将自动从训练样本中移除。请注意,此“撤销”功能仅适用于最后训练的单词。

连字识别训练

连字是两个或三个“粘连”在一起的字符组合,例如 fi、fl、ffi。由于这些字符在印刷过程中连在一起,因此很难拆分。实际上,将它们视为“单个”复合字符,往往能获得更好的结果。 连字训练与单个字符训练没有区别:
  1. 键入所需的字符组合,然后单击 Train 按钮。
  2. 上方对话框窗口中的边框应框住整个连字。您可以使用鼠标,或单击 MoveBodyLeftMoveBodyRight 按钮来移动边框。
每个模式最多可包含 1000 个新字符。不过,不应创建过多的连字,否则可能会对识别质量产生不利影响。

训练限制

训练 ABBYY FineReader Engine 时,还应考虑以下限制:
  • ABBYY FineReader Engine 不区分某些通常被视为不同的字符。这类图像会被识别为同一个字符。例如,直单引号 (’)、右单引号 (’) 和左单引号 (‘) 在 pattern 中会作为同一个字符保留——即直单引号。因此,即使您尝试训练它们,识别出的 Text 中也不会出现右单引号和左单引号。
  • 在某些情况下,某个图像会因其上下文环境而被识别为特定字符。
  • CJK 语言不支持模式训练。

另请参见

通过训练进行识别 RecognizerParams