跳转到主要内容
本主题适用于 Windows 版 FRE。
下方列出了 5.0 到 11 版本的功能概览。

ABBYY FineReader Engine 5.0 的新增功能 (发布于:05/2001)

  • 与 4.0 版本相比,识别质量提高了 1.5 到 2 倍
  • 保存为 HTML 和 PDF 格式时可完整保留页面版面
  • 完整保留文本颜色
  • 支持识别下标字符和简单化学公式
  • 支持识别竖排文本以及“嵌入”表格单元格中的图片
  • 双页拆分
  • 176 种识别语言,包括编程语言 Basic、C/C++、COBOL、Fortran、JAVA、Pascal,以及新的语言字典
  • 组件对象模型 (COM) API,可从任何支持 COM 接口的开发环境中访问 (Visual Basic .NET、C/C++ 等)
  • 用于创建用户语言和字典的 API
  • 通过 FineReader 训练对话框训练机器印刷字符用户模式的工具
  • 新的 HTML 帮助,提供可直接从 VB 对象浏览器访问的上下文相关主题

ABBYY FineReader Engine 6.0 的新增功能 (发布于:08/2002)

  • 改进了低印刷质量文档的识别算法。改进后的算法采用了新的自适应图像二值化方法和新的背景去除方法,尤其适用于以“灰度”模式扫描的图像
  • 新的 PDF 保存模式——“仅图像”
  • 保存为 Excel 格式时可保留文本对齐方式
  • 以 RTF 格式保存非矩形图片,并重建项目符号和编号
  • 177 种识别语言
  • 支持新的识别字体:OCR-A、OCR-B 和 MICR (E13B)
  • 除 FineReader 6.0 Engine Standard 外,所有 FineReader 6.0 Engine 版本均提供快速模式。该模式可实现更快的识别速度,但图像质量较差
  • ASCII 版本中的新功能:支持预处理图像文件、识别多页图像文件以及处理内存图像
  • 新的许可证管理器实用程序

ABBYY FineReader Engine 7.0/7.1 的新增功能 (发布于:07/2004)

  • 识别质量提升约 25%
  • 支持打开和处理 PDF 文件
  • 新增识别语言:繁体中文、简体中文和日语
  • 新增古欧洲语言:古英语、古法语、古德语、古意大利语和古西班牙语
  • 支持识别 Fraktur/Black Letter 字体
  • 支持 JPEG2000 第 1 部分
  • 支持从多页 TIFF 或 PDF 文件中打开指定页面
  • 新增条码分析和识别方法
  • 支持新类型的一维条码:无校验和的 CODABAR、UCC Code 128、Industrial 2of5、IATA 2of5、Matrix 2of5、Code 93、UPC-A 和 UPC-E
  • 支持 Microsoft Word XML 和 ASCII XML 输出
  • 支持导出到 MS PowerPoint
  • 改进了发票的 DA;支持页面方向检测;支持一维条码检测,包括任意角度的条码检测
  • 改进了表格检测和分析,尤其是对无印刷网格线的表格以及带彩色行列的表格
  • 改进了自适应二值化和背景过滤
  • 新增字典:英语和德语的法律、医学字典
  • 可将识别结果保存为线性化 PDF 文件:用户无需等整个文件下载完成即可先查看 PDF 的前几页
  • 改进了将已编辑文本保存为 PDF 格式的功能
  • 对导出为 HTML 和 RTF 格式进行了多项改进
  • 提供网络 Runtime 许可证
  • 支持表单和半结构化文档处理,并支持 ABBYY FormReader 和 FlexiCapture
  • 新增 ICR 识别语言:匈牙利语、希腊语和克罗地亚语
  • 支持阿拉伯语 ICR 数字
  • ICR 快速模式

ABBYY FineReader Engine 8.0/8.1 的新增功能 (发布于:09/2005)

  • 支持 Voting API
  • 增强了字段级识别:ICR 快速模式、对带下划线字段的文本提取效果更佳、文本块去斑点、在含空格字段上的识别结果更好,以及支持包含空格词语的字典
  • 支持 PDF/A
  • 对低分辨率文档和传真件的识别准确率最高提升 30%
  • 对使用数码相机采集的文档,识别准确率最高提升 40%
  • 可校正数码相机拍摄图像中的文本行
  • 新增输入图像格式 (GIF 和 DjVu)
  • OCR 平衡处理模式
  • 新增用于全文索引的文档分析
  • 改进了 PDF 处理和创建功能,处理速度最高提升 2 倍,识别准确率提高,安全选项增强,支持带标签的 PDF 文件,并可控制 PDF 页面大小
  • 支持新的条码类型 — EAN 13 Supplemental
  • 支持 CMC7 Text 类型
  • 进一步增强了对外部字典的支持
  • 改进了表单和半结构化文档处理
  • 可按需或预先加载引擎子系统
  • 可获取已识别单词和字符的所有可能假设
  • 可在日志文件中跟踪引擎调用
  • 即时进行核心识别调优
  • OCR 新增语言:泰语
  • OCR 新增语言:希伯来语
  • 扩展了导出为 PDF 和 RTF 时对亚洲语言的支持
  • 可在引擎配置文件中保存外部数据

ABBYY FineReader Engine 9.0 的新增功能 (发布于:10/2008)

  • 由于 ADRT 将整个文档作为一个整体处理,因此生成的文档在所有页面上的格式都保持一致。
  • 新的 API 对象支持分别设置页面合成和文档合成的参数。
  • 在分析和识别多页文档时,可利用全部 CPU 内核。
  • 可检测最高 20 度的图像旋转,并可根据水平和垂直的成对黑色方块、线条以及文本行进行倾斜校正。
  • 开发人员可以让用户直接但受控地访问识别结果,以及用于验证或检查文档的功能。
  • 可将识别后的文档导出为 Microsoft Office 2007 引入的全新、开放、可互操作且可靠的基于 XML 的格式
  • MRC 压缩可在不明显降低文档显示质量的情况下显著提升压缩效果。与 JPEG 压缩相比,文件大小最高可缩小 10 倍。
  • 新的许可方案允许页面受限的许可证使用不限数量的内核。
  • 新增不带页面计数器的许可证,定价改为基于可使用的最大 CPU 内核数。

ABBYY FineReader Engine 10 新功能 (发布于:08/2010)

  • 构建文档地图和目录、处理图片标题,以及用于文档结构合成结果的新 API。
  • 支持阿拉伯语识别,并改进了中文、日语、韩语、泰语、希伯来语、越南语和古欧洲语言识别。
  • 改进了图像二值化、图像颜色过滤和照片预处理:校正 3D 透视畸变、模糊校正、ISO 噪声抑制。
  • 标准识别模式速度更快,对多核的支持也有所改进。
  • 可将识别后的文档导出为电子书格式。
  • 巴西葡萄牙语、韩语、中文 (中国) 、中文 (台湾) 、丹麦语、希腊语。
  • 只需设置少量参数,即可更轻松地调整 PDF (PDF/A) 导出,并改进了 PDF MRC 导出。

ABBYY FineReader Engine 11 的新增功能 (发布:10/2013)

  • 可训练分类器 (支持自定义文档特征) 并将其用于识别文档类型。
  • 支持古教会斯拉夫语和波斯语识别,并改进了阿拉伯语、拉丁语、阿塞拜疆语、俄语 (旧拼写) 和土库曼语的识别。ICR 新增支持的语言包括:丹麦语、挪威语 (Bokmal) 、挪威语 (Nynorsk) 、古英语、塞尔维亚语 (西里尔文) 和塔吉克语。
  • 可为任何语言创建用户字典,包括中文、日文和韩文。
  • 改进了表格检测、所有语言的竖排文本检测,新增了技术图纸识别配置文件,可访问文档合成期间使用的字体,并改进了文本类型检测。
  • 支持噪声去除、对比度增强、自动裁剪和页面拆分、检测 PDF 文本层、指定 PDF 光栅化分辨率、提取 PDF 字体名称、彩色对象过滤以及特殊照片处理模式。
  • 可访问扫描仪的扩展属性,支持异步扫描模式,并可按 API 和 UI 类型筛选可用扫描仪。
  • 支持大型文档导出、并行进程导出、符合 PDF/A 标准的导出格式、支持线性化 PDF 文件、文本层注入以及导出 PDF 附件。
  • 新增 XPS 导出格式,并为 PPTX、RTF、DOCX、XLSX、HTML、XML、TXT、EPUB 和 FB2 格式提供多种新的导出功能。
  • 支持 MaxiCode、Code 32、Full ASCII Code 39、Intelligent Mail 条码类型、高级条码检测模式、针对速度优化的新条码识别配置文件,以及低矮条码检测。
  • 支持冗余许可证服务器配置,并可处理许可证服务器连接错误。
  • 支持版面清理、批处理控制、对象计数跟踪、空白页面检测等。