跳转到主要内容
此对象用于调整页面预处理的各项参数。页面预处理在页面分析之前执行。此阶段包括校正页面方向、反相图像以及消除几何失真。指向此对象的指针会作为 PageProcessingParams 对象的一个成员传递给处理方法。 PagePreprocessingParams 对象是一个持久性对象。这意味着该对象的当前状态可以写入持久存储。之后,可以通过从持久存储中读取对象状态来重新创建该对象。以下方法用于实现对象的持久化: Linux:SaveToFileLoadFromFile Windows:SaveToFileLoadFromFileSaveToMemoryLoadFromMemory

属性

,read-only

返回对象。

指定是否对图像背景进行白化处理。

此属性的默认值为 TSPV_Auto。在默认模式下,ABBYY FineReader Engine 会对背景进行白化处理。

指定在页面预处理期间是否消除几何失真 (照片中的透视变形、扫描书籍中的曲线等) 。

此属性的默认值为 TSPV_Auto。在默认模式下,ABBYY FineReader Engine 会对照片进行几何校正。

指定是否校正反色图像。

此属性的默认值为 TSPV_Auto。在默认模式下,ABBYY FineReader Engine 会校正反色图像。

指定在预处理期间如何校正图像方向。

默认值为 COM_Auto,表示在需要时自动判断并校正方向。

若此属性设置为 CSM_Auto 或 CSM_Fast,则在页面预处理期间将校正图像倾斜。

倾斜校正仅支持不超过 20 度的角度。

此属性的默认值为 CSM_Auto,表示执行精确的倾斜校正。

若此属性设置为 TSPV_Yes,则在预处理期间,ABBYY FineReader Engine 将检测图像中的文档边缘并相应地裁剪图像。

此功能不支持黑白图像。

此属性的默认值为 TSPV_Auto。在默认模式下,ABBYY FineReader Engine 将根据所处理图像的来源,自动裁剪图像或跳过此步骤。

指定图像类型的判断方式,与 ImageSourceType 配合使用。

默认值:TSPV_Auto (仅在ImageSourceType = IST_Auto时生效) 。

    • TSPV_Auto/TSPV_Yes — Engine 自动检测图像类型。
    • TSPV_No — Engine 不进行检测,而是从文件属性/元数据中读取图像类型 (速度更快,但依赖元数据的准确性) 。
  • ImageSourceType显式设置为 IST_Photo、IST_Scan, IST_Screenshot、IST_SyntheticImage 或 IST_SyntheticText,则不执行检测 (视为 TSPV_No) ,引擎将从 属性/元数据中读取图像类型。

将此属性设置为 TRUE 时,ABBYY FineReader Engine 将在预处理后的图像中仅保留黑白平面。此时,图像二值化将在图像预处理阶段执行。

默认情况下,此属性设置为 FALSE。

如果此属性设置为 ORM_Auto,ABBYY FineReader Engine 将自动检测并覆盖图像分辨率。

如果设置为 ORM_Manual,请使用属性指定新的图像分辨率。

新分辨率将在图像准备的所有其他阶段 (如二值化、纠偏等) 之前应用。

注意:

  • 如果将此属性设置为 ORM_No,且预处理后图像的分辨率过低 (低于 50 dpi) 、过高 (高于 3200 dpi) 或未定义,则图像将无法打开并报错。
  • 如果打开的是 PDF 文件,新分辨率将用于图像光栅化;图像的像素尺寸可能会根据检测到的分辨率和页面尺寸进行调整。

默认情况下,该属性的值为 ORM_Auto。

OverwriteResolutionMode 属性设置为 ORM_Manual 时,此值用于覆盖预处理图像的分辨率。

请注意,此属性的默认值为 0,因此你必须自行设置所需的值。如果将 OverwriteResolutionMode 设置为 ORM_Manual 但未为此属性设置值,则会报错。

指定页面拆分的参数。

指定线条的矫直方式。

此属性默认为 SLM_Auto,此时将使用新的神经网络算法。

如果此属性为 TRUE,ABBYY FineReader Engine 将使用快速图像二值化算法。二值化将在预处理阶段执行 (如果 DiscardColorImage 为 TRUE) ,或在需要黑白图像时执行 (例如,首次对已打开的图像文档调用属性时) 。将此属性设置为 TRUE 可加快二值化速度,但可能会降低质量。

默认情况下,此属性的值为 FALSE。

指定分辨率的检测方式

此属性默认为 RDM_Auto,此时将使用新的神经网络算法。




方法

名称描述
CopyFrom使用另一个对象中对应属性的值初始化当前对象的属性。
LoadFromFile从磁盘上的文件恢复对象内容。
LoadFromMemory <Note> : 仅限 Windows。 </Note>从全局内存恢复对象内容。
SaveToFile将对象内容保存到磁盘上的文件中。
SaveToMemory <Note> : 仅限 Windows。 </Note>将对象内容保存到全局内存中。
PagePreprocessingParams 对象图

输出参数

此对象是 Engine 对象的 CreatePagePreprocessingParams 方法的输出参数。

输入参数

此对象会作为输入参数传递给以下方法:

示例

该对象可用于以下代码示例:

另请参阅

预处理、分析、识别和合成的调优参数 使用属性