跳转到主要内容
如果某个术语仅适用于 FRE 的特定平台,其后会标注 L (Linux)、M (macOS) 或 W (Windows)。

A-E

F-O

P-Z

ABBYY FineReader Engine

一款软件开发工具包,可让软件开发人员创建能够从纸质文档或图像中提取文本信息的应用程序。别名:FineReader Engine、FRE、FREngine。

API

应用程序编程接口。了解更多信息:Wikipedia

二值化或自适应二值化

将灰度图像或彩色图像转换为黑白图像的过程。在 FineReader Engine 中,会为每个图像片段动态调整亮度平衡,以获得最佳处理质量。

Block

ABBYY FineReader Engine API 的一个内部实体,用于定义源图像中的区域及其类型 (文本、条码、复选标记等) 。Block 可以手动标记,也可以在文档分析后自动创建。Block 决定图像各区域的识别方式及识别顺序,并在识别完成后包含识别结果。了解更多:Block使用 Layout 和 Block

CJK 或 CJK 语言

中文 (简体和繁体) 、日语和韩语。了解详情:识别 CJK 语言.

CLI

命令行界面。要了解它在 ABBYY FineReader Engine 中的实现方式,您可以参考发行包中附带的相应代码示例。该代码示例通过大量选项支持 ABBYY FineReader Engine API 的大多数功能。

置信度级别

文本中采用特定字符的概率。了解更多:使用 Voting API

混淆矩阵或误差矩阵

一种用于表示对象分类算法结果的表格。了解更多:WikipediaConfusionMatrix

容器

一种包含完整运行时环境的软件单元,用于将应用程序及其所有依赖项打包在一起,确保其能够在各种计算环境中稳定运行。了解更多:Docker 网站在 Docker 容器中运行 ABBYY FineReader Engine 12 (Linux 和 Windows) 。

计数器或许可证计数器

一种许可证实体,用于限制在特定期间内可识别并导出的页面数或字符数。

CPID

客户项目 ID。开发期间用于初始化产品的唯一字母数字 string。此 string 可与一个或多个序列号 (Developer 或 Runtime 许可证) 关联,并由 ABBYY 销售代表签发。了解更多:InitializeEngine

DIB (W)

设备无关位图。您可以直接从内存中打开 DIB 文件。详细信息请参见:WikipediaOpenDibPrepareDib

DLL

动态链接库。适用于 Windows 的 ABBYY FineReader Engine 分发包包含一组可集成到客户产品中的 .dll 文件。了解更多信息:Wikipedia

文档分析

OCR 中负责检测文档结构元素并创建 Layout 的步骤,该 Layout 会呈现一组Block。了解更多:文档分析使用 Layout 和块

Dpi

每英寸点数。了解更多信息:Wikipedia

EULA

最终用户许可协议。本文档随 ABBYY FineReader Engine 发行包提供,也可通过在线帮助查看。了解更多:Wikipedia

EXIF

可交换图像文件格式。一种标准,用于描述数码相机拍摄的图像文件或音频文件中附带的特定数据 (例如 GPS 位置、日期/时间、相机设置等) 。了解更多:Wikipedia

提取

从图片或文本中提取数据的过程。该过程可应用于识别文本、条码、字段或 MRZ 的场景。此外,提取还可用于获取图像中的其他对象。了解更多:ObjectExtractionParams

假设

文本中单个字符或单词的一种识别结果变体。每个假设都有一个置信度级别,在需要从多个变体中选出最合适的一个时,这一信息非常有用。了解更多:使用 Voting API

ICAO

国际民用航空组织。该组织负责制定机器可读旅行证件的标准和规范。了解更多信息:请访问 ICAO 网站

ICR

智能字符识别。该技术用于识别手写的印刷体字符,即彼此分离的单个字符。这些字符可在文档的字段、方框和边框中进行检测。了解更多:OCR 和其他识别技术Recognizing Handwritten Texts

InprocLoader (W)

一个对象,用于在与客户端相同的进程内,将 ABBYY FineReader Engine 作为进程内服务器 (DLL) 进行加载和卸载。客户端与进程内服务器之间的通信基于对对象实现的直接调用。

JNI (L, W)

Java 本地接口。一种标准编程接口,用于在 Java 虚拟机中运行 Java 代码,并将 Java 代码嵌入到使用 C、C++ 和汇编语言编写的本地应用程序中。了解更多:Wikipedia在 Java 中使用

库模块

由一组许可证模块组成,定义了用户可用的 ABBYY FineReader Engine 功能,并决定执行该功能所需的文件。了解更多:库模块 (适用于 Windows) 。

许可证模块

一种许可证实体,用于授权访问 ABBYY FineReader Engine 的特定功能。每个许可证模块都对应一个需要安装的特定库模块。了解更多:模块

许可证服务器 (L, W)

一个独立的工作站,用于安装和管理 ABBYY FineReader Engine 的许可组件:许可服务许可证管理器 实用程序。使用网络许可证通过网络向各个工作站分发许可证时,需要使用许可证服务器。借助许可证管理器实用程序,您可以通过图形用户界面或命令行界面管理所有类型的 ABBYY FineReader Engine 许可证。了解更多信息:许可

连字

由两个或多个字符组合而成的字符。详细了解:Wikipedia 或 Windows 版的训练用户模式

加载器或引擎加载器

用于初始化 ABBYY FineReader Engine API 主引擎对象的接口和对象。在不同操作系统上,加载引擎对象的方式有多种:

Windows

Linux

macOS

独立应用程序

  • 使用标准 InitializeEngine 函数
  • 通过 COM 使用 InprocLoader

使用标准 InitializeEngine 函数

使用标准 InitializeEngine 函数

服务器解决方案

通过 COM 使用 OutprocLoader

作为进程外服务器

不支持

要确定哪种方式更适合您的场景 (单线程或多线程应用程序、进程内或进程外加载、使用 GUI 等) ,请参阅以下内容:

LZW

Lempel–Ziv–Welch。一种将文件压缩得更小的压缩方式,通常用于 GIF,也可用于 PDF 和 TIFF。LZW 依赖于由 Abraham Lempel、Jacob Ziv 和 Terry Welch 发明的基于查找表的算法。了解更多信息:Wikipedia, ColorPictureFormatsEnum

MICR

磁性墨水字符识别。一种用于识别银行单据 (如支票和凭单) 的技术。MICR 代码既可通过 API 扫描和轻松读取,也便于人工识读。MICR 文本本身包含两种文本类型 (CMC-7 和 E13-B) ,均为字母数字类型。在 ABBYY FineReader Engine 中,这些文本类型仅支持拉丁语言。了解更多:Wikipedia文本类型

MRC

混合光栅内容。这项技术可应用于 PDF (PDF/A) 文件,将文档表示为三个不同的层:第一层是包含图片的前景层,第二层是包含文本及其颜色信息的掩模层,第三层是包含背景图片或纹理的背景层。每一层都会根据其数据类型,分别采用最合适的压缩方式进行压缩。了解更多:PDF Conversion

OBR

光学条码识别。自动检测、识别和判定图像中条码的过程。了解更多:OCR 和其他识别技术条码类型识别条码

OCR

光学字符识别 (OCR) 。指一种通过电子处理将包含手写、打字或印刷文字的图像 (通常由扫描仪采集) 转换为机器可编辑文本的多步骤过程。它包括预处理、文档分析、识别和合成。了解更多:OCR 和其他识别技术

在线许可服务或 ABBYY 在线许可服务 (L, W)

ABBYY 侧提供的一项服务,用于通过定期检查验证特定在线许可证的真实性和有效性。了解更多:在线许可

OMR

光学标记识别 (Optical Mark Recognition) ,也称勾选标记识别 (Checkmark Recognition) 。它是指对开发者定义的图像或文档区域中的勾选标记进行自动检测和识别的过程。了解更多:OCR 和其他识别技术Recognizing Checkmarks

OutprocLoader (W)

一个对象,用于在与客户端位于同一台机器上的单独进程中,将 ABBYY FineReader Engine 作为进程外服务器 (EXE) 加载和卸载。客户端与进程外服务器之间的通信基于跨进程边界调用。

PDFium

一个跨平台库,用于打开 PDF、将其转换为图像,或提取其中的附件、字体和元数据。了解更多:Googlesource

纯文本或 PlainText

ABBYY FineReader Engine 对象,仅包含由识别出的字符组成的文本。该文本基于字符置信度及其在源图像中的位置信息。识别结果会有意排除框线、表格及其他版面元素相关信息,只保留字符。了解更多:PlainText

预处理或图像预处理

这一过程可提升文档图像质量,以便进行后续识别或归档。

配置文件

一组设为合理默认值的 ABBYY FineReader Engine 参数。每个配置文件都可应用于使用 ABBYY FineReader Engine 的特定场景。了解更多信息,请参阅:使用配置文件

Pt

点 (Point) ,即排印点,等于 1/72”。了解更多:Wikipedia.

光栅化

将图像转换为光栅图像的过程,例如转换为由像素、点或线构成的图像。了解更多:Wikipedia

识别

从图像中的每个Block提取数据 (文本、条码、勾选标记等) ,并将其转换为机器可编辑信息的过程。了解更多:OCR 和其他识别技术

Region

ABBYY FineReader Engine 中的一种内部实体,围绕一个或多个文档元素形成。单个 Region 可包含一个或多个 Rectangle。了解更多:Region

RHEL (L)

Red Hat Enterprise Linux。

RMI (L)

远程方法调用。一种通过从一个 Java 虚拟机调用另一个 Java 虚拟机,在远程对象上调用方法的机制。了解更多:Wikipedia在 Java 中使用

场景

一组最适合使用 ABBYY FineReader Engine 执行特定文档处理任务的步骤和建议。了解更多:基本使用场景实现

合成

OCR 的一个步骤,负责使用 ABBYY FineReader Engine 检测文档的逻辑结构 (如目录、文本顺序、字体样式、标题等) 。将识别结果导出为 TXT 格式文件或纯图像 PDF 时,可以跳过此步骤。

训练 (W)

在识别具有特殊特征的文档 (如特定字体〔装饰体或空心体〕、字符〔连字〕等) 以及按照某些标准对文档进行分类 (例如是否包含条码、MRZ、发票等) 之前执行的一项预处理过程。了解更多:结合训练进行识别

Twip

一种排印计量单位,等于 排印点的 1⁄20 或 1/1440 英寸。了解更多:维基百科

TWAIN (W)

一种跨平台 API 和协议,用于软件与扫描仪、网络摄像头、CCTV 或数码相机等数字图像设备之间的通信。了解更多:Wikipedia扫描

Visual Components 或 VC (W)

ActiveX 组件库和辅助 COM 类。ABBYY FineReader Engine 提供了一组图形用户界面元素,帮助您创建自己的 OCR 应用程序,用于扫描、编辑图像、核对识别文本等。了解更多信息:Visual Components 参考

虚拟机

在虚拟环境中对物理计算机及其特性的模拟。它既可以远程访问,也可以额外安装在计算机上。了解更多:Wikipedia

XFA

XML Forms Architecture。一种 XML 规范,用于描述带有用户指定数据的交互式 Web 表单的处理规则。了解更多信息:Wikipedia

WIA (W)

Windows Image Acquisition。用于使图形软件能够与打印机、扫描仪、数码相机及其他视频设备等硬件通信的 API 和协议。了解更多:Wikipedia扫描

工作站

用于安装和使用 ABBYY FineReader Engine 库的计算机。要开发基于该库的应用程序,您需要开发者许可证。如果使用已分发的应用程序,则只需 Runtime 许可证。了解更多信息:许可管理

ZUGFeRD

德国电子发票论坛 (Forum elektronische Rechnung Deutschland) 的《中央用户指南》 (德语) ,英文为 Central User Guide for Electronic Invoicing。这是一项德国电子发票标准,规定了 PDF 文档 (应符合 PDF/A-3 标准) 与 XML 结构化数据集成的格式。了解更多信息:符合 ZUGFeRD 标准的电子发票