图像预处理

为什么要改进图像？

改进图像质量这项工作有两个目的。一方面，我们需要提高图像质量，使其更适合 OCR。

另一方面，我们还需要改善图像的显示效果，例如在将文档图像存档时，这一点就很有必要。

由于 ABBYY 技术专注于文档分析和识别，系统集成了一套强大的图像预处理技术：自适应二值化、失真校正、文本行校直、对开页拆分等。无需借助第三方工具，也能获得准确的 OCR 结果。ABBYY 提供了一整套面向 OCR 的预处理技术。

接收图像后，ABBYY FineReader Engine 会执行一系列图像预处理操作，以提升文档图像质量，从而便于后续识别或归档：


	此文档图像处理功能对于批量导入图像非常重要，尤其适用于文档页面扫描方向未知或各页方向不一致的场景。系统会自动检测每个页面的方向，并在必要时加以校正。
	此功能用于以双页展开方式扫描书籍，可同时处理左右两页。将页面拆分为两个单独页面 (每个页面对应书籍的一页) 后，识别质量将显著提升。系统随后会对每个页面分别执行识别和版面分析，并在需要时进行纠偏处理。
	这是一项重要的文档图像处理功能，适用于需要校正图像倾斜的扫描文档。该功能无需依赖前缘边框或线条。新版 ABBYY FineReader Engine 12 提供多种图像纠偏方法：成对黑色方块、线条或文本行。
	从扫描或拍摄的书籍中提取文本时，文本行可能弯曲不平，难以进行 OCR 识别。ABBYY 技术提供专用算法，可纠正倾斜并校直文本行，从而实现准确的文本识别。
	扫描质量较差或中等的文档时，所得图像可能含有大量噪声，表现为图像上密集的点状或斑点状干扰。这些斑点若出现在字母或数字附近，可能会影响 OCR 识别质量。此功能可去除此类噪声，用户可自行指定待去除斑点的大小，既可应用于整幅图像，也可应用于图像中的任意单个块 (或区域) 。
	该技术可自动识别数码照片，并校正数码相机拍摄时常见的各类失真。系统能够识别数字图像中的典型缺陷，例如文本行变形、梯形三维失真、焦点模糊、污迹、厚书对开页的暗角、眩光、ISO 噪声等，并自动加以校正，用户无需借助任何第三方应用程序来处理照片。
	纹理滤波技术可过滤背景”噪声” (如颜色和纹理) ，从而提高对难以识别的文档 (如新闻纸、彩色文档、传真件和复印件) 的识别准确率。


	该过程将图像转换为黑白图像，去除噪声、背景和纹理，从而获得清晰的文本。此过程可确保最佳的 OCR 质量。每个片段所需的参数均单独确定。对于较薄的报纸，反面印刷的文字可能会在扫描件中透显出来。自适应二值化可消除此类透印文字。创新性的自适应二值化技术在识别过程中动态调整每个图像片段的亮度阈值。通过为各片段应用独立的识别参数，该技术能够对具有灰度或色彩渐变对比度背景及纹理的文档产生准确的识别结果。
	这是使用极小点对灰度图像进行二值化的过程。它可以改善文档的视觉效果，使文档呈现出更丰富的色调层次。

该过程将图像转换为黑白图像，去除噪声、背景和纹理，从而获得清晰的文本。此过程可确保最佳的 OCR 质量。每个片段所需的参数均单独确定。对于较薄的报纸，反面印刷的文字可能会在扫描件中透显出来。自适应二值化可消除此类透印文字。

创新性的自适应二值化技术在识别过程中动态调整每个图像片段的亮度阈值。通过为各片段应用独立的识别参数，该技术能够对具有灰度或色彩渐变对比度背景及纹理的文档产生准确的识别结果。

这是使用极小点对灰度图像进行二值化的过程。它可以改善文档的视觉效果，使文档呈现出更丰富的色调层次。

二值图像过滤器
图像缩放	对于以较低分辨率 (低于 120 dpi) 扫描的文档，以及字体较小 (低于 10 pt) 的文档，可以对图像进行数字放大，以获得更好的 OCR 质量。

另请参见

主要功能

概述

主要新功能

图像预处理

为什么要改进图像？