跳转到主要内容
此对象以特殊的“纯文本”格式表示识别到的文本。它仅提供有关已识别文本符号、识别置信度以及相对于源图像位置的信息。您既可以获取单个字符的这些信息,也可以获取文本中所有字符的这些信息。
对于条码识别,PlainText 对象的 Text 属性为空。如果您需要获取包含单个条码的单页文档的识别文本,请使用版面中第一个块的 Text 属性:
document.Pages[0].Layout.Blocks[0].GetAsBarcodeBlock().Text

属性

,read-only

返回 Engine 对象。

, read-only

以 Unicode string 的形式提供对完整识别文本的访问。该 string 可能包含以下特殊字符:

  • 0x2028 — 换行符
  • 0x2029 — 段落分隔符
  • 0xFFFC — 对象替换字符 (表示文本中嵌入的图片)
  • 0x0009 — 制表符
  • 0x005E — 扬抑符 (^) ,ABBYY FineReader Engine 用此字符替代无法识别的字符
  • 0x00AC — 软连字符
如果图像中包含表格,表格单元格中的文本将按逻辑阅读顺序 (从左到右、从上到下) 存储。

, read-only

返回文本中的符号数量,包括特殊字符。

, read-only

该属性以识别文本中某个符号的索引作为输入参数,返回指定符号所在页面的编号。

, read-only

返回字符的识别置信度值,即主 (选定) 识别变体的置信度。

置信度用于估算识别变体的准确性,不应将其视为通用的识别质量指标:置信度唯一可靠的用途是比较同一字符的不同识别变体。从源 PDF 文件中直接提取 (未经识别) 的字符,其置信度固定为 55。

, read-only

返回指定字符被错误识别的估计概率 (取值范围为 0 到 100) 。

, read-only

如果指定字符的识别结果不可靠,则返回 TRUE。可使用此属性判断是否需要进行验证。

该属性根据 ErrorProbability 值和识别设置计算得出。如果需要对验证进行更精细的区分,请改用 ErrorProbability

, read-only

该属性以识别文本中某个符号的索引作为输入参数,返回该符号矩形下边界相对于纠偏后black-and-white平面。

,只读

该属性以识别文本中某个符号的索引作为输入参数,返回该字符 Rectangle 左边界相对于源图像纠偏后黑白平面的坐标。

,只读

该属性以识别文本中某个符号的索引作为输入参数,返回该符号 Rectangle 右边界相对于源图像纠偏后黑白平面的坐标。

,只读

该属性以识别文本中某个符号的索引作为输入参数,返回该符号 Rectangle 上边界相对于源图像纠偏后黑白平面的坐标。

方法

名称描述
GetCharacterData <Note> 仅限 Windows。 </Note>以一组数组的形式返回文本中所有字符的信息:字符所在的页面编号、字符矩形区域的坐标以及字符的置信度。
SaveToAsciiXMLFile将识别的文本保存为 XML 文件。
SaveToTextFile使用指定编码将识别的文本保存为文本文件。
PlainText 对象图

另请参阅

CharConfidence、ErrorProbability 和 IsSuspicious 之间有什么区别? 处理 Text 处理属性