跳轉到主要內容
如果某個術語僅適用於 FRE 的特定平台,後面會標示 L (Linux) 、M (macOS) 或 W (Windows) 。

A-E

F-O

P-Z

ABBYY FineReader Engine

一套軟體開發套件,讓軟體開發人員能建立可從紙本文件或影像中擷取文字資訊的應用程式。別名:FineReader Engine、FRE、FREngine。

API

應用程式設計介面。深入了解:Wikipedia

二值化或自適應二值化

將灰階或彩色影像轉換為黑白影像的過程。在 FineReader Engine 中,系統會動態調整每個影像片段的明暗平衡,以達到最佳處理品質。

Block

ABBYY FineReader Engine API 的內部實體,用於定義原始影像的區域及其類型 (文字、條碼、勾選記號等) 。Block 可手動標記,也可在文件分析後自動建立。Block 會決定影像中待辨識區域的處理方式與順序,並在辨識後保存結果。進一步瞭解:Block使用 Layout 和 Blocks

CJK 或 CJK 語系

中文 (簡體與繁體) 、日文和韓文。進一步了解:辨識 CJK 語系

CLI

命令列介面。若要了解 ABBYY FineReader Engine 如何實作此介面,您可以使用 發行套件 中附帶的對應程式碼範例。此程式碼範例透過眾多選項參數支援 ABBYY FineReader Engine API 的大部分函式。

置信度

文字中使用特定字元的機率。進一步瞭解:使用 Voting API

混淆矩陣或誤差矩陣

顯示用於物件分類之演算法結果的表格。進一步了解:WikipediaConfusionMatrix

容器

一種軟體單元,內含完整的執行階段環境,可將應用程式及其所有相依項目一併封裝,確保能在各種運算環境中穩定執行。進一步了解:Docker 網站在 Docker 容器中執行 ABBYY FineReader Engine 12 (Linux 和 Windows) 。

計數器或授權計數器

一種授權實體,用於限制在特定期間內可辨識及匯出的頁面或字元數。

CPID

Customer Project ID。這是一組英數字元組合,在開發期間用作產品初始化的唯一 string。此 string 可與一個或多個序號 (Developer 或 Runtime 授權) 建立關聯,並由 ABBYY 業務代表核發。進一步瞭解:InitializeEngine

DIB (W)

裝置獨立點陣圖。您可以直接從記憶體開啟 DIB 檔案。了解更多資訊:WikipediaOpenDibPrepareDib

DLL

動態連結程式庫。適用於 Windows 的 ABBYY FineReader Engine 發行套件包含一組可整合至客戶產品的 .dll。進一步了解請參閱:Wikipedia

文件分析

OCR 中負責偵測文件結構元素並建立 Layout 的步驟;Layout 會提供一組區塊。進一步了解:文件分析使用 Layout 和區塊

Dpi

每英吋點數。深入瞭解:Wikipedia

EULA

終端使用者授權合約。此文件包含於 ABBYY FineReader Engine 發行套件中,或可透過線上說明查閱。進一步了解:Wikipedia

EXIF

可交換圖像檔案格式。一種標準,用來描述隨數位相機拍攝的影像或音訊檔一併儲存的特定資料 (例如 GPS 位置、日期/時間、相機設定等) 。進一步了解:Wikipedia

擷取

從圖片或文字中擷取資料的過程。此程序適用於辨識文字、條碼、欄位或 MRZ 的情境。此外,擷取也可用來擷取影像中的其他物件。進一步了解:ObjectExtractionParams

假設

文字中單一字元或單字的其中一種辨識結果。每個假設都有一個置信度,在需要從多個變體中選出最合適的版本時很有幫助。進一步瞭解:使用 Voting API

ICAO

國際民用航空組織。此組織負責制定機器可讀旅行證件的標準與規範。進一步瞭解:請參閱 ICAO 網站

ICR

智慧字元辨識。這項技術用於辨識手寫的印刷體、彼此分離的單個字元。這些字元會在文件的欄位、方塊和框線中偵測。了解更多:OCR and Other Recognition TechnologiesRecognizing Handwritten Texts

InprocLoader (W)

一個物件,可讓您在與用戶端相同的處理程序中,以程序內伺服器 (即 DLL) 的形式載入及卸載 ABBYY FineReader Engine。用戶端與程序內伺服器之間的通訊,是透過直接呼叫物件實作來進行。

JNI (L, W)

Java Native Interface。這是一種標準的程式設計介面,用於在 Java 虛擬機器中執行 Java 程式碼,並將其嵌入以 C、C++ 和組合語言編寫的原生應用程式。進一步瞭解:Wikipedia在 Java 中使用

程式庫模組

由一組授權模組組成,共同構成 ABBYY FineReader Engine 中可供使用者使用的功能,並決定執行該功能所需的檔案。深入了解:程式庫模組 (Windows) 。

授權模組

用於提供 ABBYY FineReader Engine 特定功能存取權的授權實體。每個授權模組都對應到一個需要安裝的程式庫模組。了解更多:模組

授權伺服器 (L, W)

用於安裝及管理 ABBYY FineReader Engine 授權元件的獨立工作站:Licensing ServiceLicense Manager 公用程式。使用 Network License 透過網路將授權分配到各工作站時,必須使用 License Server。License Manager 公用程式可讓您透過圖形化使用者介面或命令列介面管理所有類型的 ABBYY FineReader Engine 授權。若要進一步了解,請參閱:Licensing

連字

由兩個以上字元結合而成的字元。進一步了解:Wikipedia 或適用於 Windows 的訓練使用者模式

載入器或 Engine 載入器

用於初始化 ABBYY FineReader Engine API 主要 Engine 物件的介面與物件。在不同作業系統上,有多種方式可載入 Engine 物件:

Windows

Linux

macOS

獨立應用程式

  • 使用標準 InitializeEngine 函式
  • 透過 COM 使用 InprocLoader

使用標準 InitializeEngine 函式

使用標準 InitializeEngine 函式

伺服器方案

透過 COM 使用 OutprocLoader

作為處理序外伺服器

不支援

若要根據您的使用情境選擇較合適的方式 (例如單執行緒或多執行緒應用程式、處理序內或處理序外載入、是否使用 GUI 等) ,請參閱下列內容:

LZW

Lempel–Ziv–Welch。一種將檔案壓縮為較小檔案的壓縮方式,通常用於 GIF,也可選用於 PDF 和 TIFF。LZW 採用由 Abraham Lempel、Jacob Ziv 和 Terry Welch 發明的表格式查找演算法。進一步了解:WikipediaColorPictureFormatsEnum

MICR

磁性墨水字元辨識。一種用於識別銀行票據 (例如支票和憑單) 的技術。MICR 代碼可透過 API 輕鬆掃描與讀取,也可由人工直接辨讀。MICR 文字本身包含兩種文字類型 (CMC-7 和 E13-B) ,皆為英數字元。在 ABBYY FineReader Engine 中,這些文字類型僅能在拉丁字母語言中辨識。深入瞭解:WikipediaText Types

MRC

混合光柵內容。這項技術可套用於 PDF (PDF/A) 檔案,並將文件呈現為三個不同的圖層:第一層是包含圖片的前景層,第二層是包含文字及其顏色資訊的遮罩層,第三層是包含背景圖片或紋理的背景層。每個圖層都會依資料類型分別採用最適合的壓縮方式。進一步了解:PDF Conversion

OBR

光學條碼辨識。指在影像中自動偵測、辨識及判別條碼的過程。進一步瞭解:OCR 與其他辨識技術條碼類型辨識條碼

OCR

Optical Character Recognition (OCR) 。指將包含手寫、打字或印刷文字的影像 (通常由掃描器擷取) 以電子化方式轉換成機器可編輯文字的多步驟流程。此流程包含預處理、文件分析、辨識與合成。深入瞭解:OCR and Other Recognition Technologies

線上授權服務或 ABBYY 線上授權服務 (L, W)

ABBYY 端提供的一項服務,透過定期檢查驗證特定線上授權的真實性與有效性。深入瞭解:線上授權

OMR

光學標記辨識或勾選記號辨識。指在開發人員所定義的影像或文件區域中,自動偵測並辨識勾選記號的過程。深入了解:OCR and Other Recognition TechnologiesRecognizing Checkmarks

OutprocLoader (W)

一個物件,可讓您在與用戶端位於同一台機器上的獨立程序中,將 ABBYY FineReader Engine 以程序外伺服器 (EXE) 的形式載入及卸載。用戶端與程序外伺服器之間的通訊是透過跨程序邊界呼叫進行。

PDFium

一個跨平台程式庫,可用於開啟 PDF、將其轉換為影像,或從中擷取附件、字型及中繼資料。深入了解:Googlesource

純文字或 PlainText

ABBYY FineReader Engine 物件,包含僅有已辨識字元的文字。此文字以字元的辨識信賴度及其在來源影像中的位置資訊為基礎。辨識結果會刻意排除框架、表格及其他版面元素的資訊,只保留字元。進一步了解:PlainText

預處理或影像預處理

可改善文件影像品質,以利後續辨識或歸檔的處理程序。

設定檔

ABBYY FineReader Engine 的一組參數,已設為合理的預設值。每個設定檔都可套用於使用 ABBYY FineReader Engine 的特定情境。深入了解:使用設定檔

Pt

點 (point) 或排印點,等於 1/72 英吋。進一步了解:Wikipedia

點陣化

將影像轉換成點陣影像的過程,例如轉成由像素、點或線組成的影像。進一步了解:Wikipedia

辨識

從影像中每個區塊擷取資料 (文字、條碼、核取記號等) ,並將其轉換為可由機器編輯的資訊之過程。進一步瞭解:OCR 與其他辨識技術

區域

ABBYY FineReader Engine 的內部實體,由一個或多個文件元素構成。單一區域可包含一個或多個矩形。進一步了解:區域

RHEL (L)

Red Hat Enterprise Linux。

RMI (L)

遠端方法呼叫。一種可透過從一個 Java 虛擬機器呼叫另一個 Java 虛擬機器,來叫用遠端物件方法的機制。進一步了解:Wikipedia在 Java 中使用

情境

一組步驟與建議,最適合用於使用 ABBYY FineReader Engine 執行特定的文件處理任務。了解更多:基本使用情境實作

合成

OCR 的其中一個步驟,負責使用 ABBYY FineReader Engine 偵測文件的邏輯結構 (如目錄、文字順序、字型樣式、標題等) 。若將辨識結果匯出為 TXT 格式檔案或純影像 PDF,則可略過此步驟。

訓練 (W)

在辨識具有特殊特徵的文件 (例如特定字型 (裝飾字或空心字) 、字元 (連字) 等) ,或依特定準則對文件進行分類 (例如是否含有條碼、MRZ、發票等) 之前所執行的預備程序。深入瞭解:使用訓練進行辨識

Twip

一種排版測量單位,等於一個排版點的 1⁄20,或 1/1440 英吋。進一步了解: Wikipedia

TWAIN (W)

用於軟體與數位影像裝置 (例如掃描器、網路攝影機、CCTV 或數位相機) 之間通訊的跨平台 API 與通訊協定。進一步瞭解:Wikipedia掃描

Visual Components 或 VC (W)

ActiveX 元件與輔助 COM 類別的程式庫。ABBYY FineReader Engine 提供一組圖形化使用者介面元素,讓您建立自己的 OCR 應用程式,以進行掃描、編輯影像、校對辨識文字等操作。進一步了解:Visual Components Reference

虛擬機器

在虛擬環境中模擬實體電腦及其特性的運算環境。可透過遠端存取,也可另外安裝在電腦上。深入了解:Wikipedia

XFA

XML Forms Architecture。一種 XML 規範,用於描述含有使用者指定資料的互動式網頁表單處理規則。深入了解:Wikipedia

WIA (W)

Windows 影像擷取。這是一種 API 和通訊協定,可讓圖形軟體與印表機、掃描器、數位相機及其他視訊設備等硬體裝置通訊。進一步瞭解:Wikipedia掃描

工作站

用於安裝 ABBYY FineReader Engine 程式庫並進行作業的電腦。若要開發以此程式庫為基礎的應用程式,您需要 Developer License。若使用分散式應用程式,則 Runtime License 即可。了解更多:授權

ZUGFeRD

德國電子發票論壇 (Forum elektronische Rechnung Deutschland) 的中央使用者指南 (德文) ,或電子發票中央使用者指南 (英文) 。這是一項德國電子發票標準,用於規範 PDF 文件 (應符合 PDF/A-3 標準) 與 XML 結構化資料整合的格式。進一步瞭解:符合 ZUGFeRD 標準的電子發票