跳轉到主要內容
PDF 格式常用於電子歸檔中的資料儲存。由於用途靈活,且能同時保留影像與文字,因此成為首選格式。 ABBYY 開發的技術可將辨識後的文字儲存為 PDF 和 PDF/A 格式。歸檔的主要目標之一,是在不犧牲資料品質的前提下,盡可能縮小檔案大小。 為了將 PDF 和 PDF/A 檔案大小降到最低,會使用一種稱為 MRC (Mixed Raster Content) 的特殊壓縮技術。

Linux 和 Windows 的 PDF 輸入

智慧型 PDF 處理

ABBYY FineReader Engine 會分析來源 PDF 檔案中的內部資訊,例如:

  • 註解,
  • 中繼資料,
  • 文字物件,
  • 字型字典
  • 內容串流

SDK 透過高效率且精準的文字選取,提升 PDF 轉換的效能與速度。如果 PDF 檔案中已嵌入文字,OCR 引擎會檢查文字層的完整性,並決定是否擷取文字,或以逐區塊的方式套用 OCR。

擷取 PDF 內部資訊

它會擷取 PDF 內部連結、超連結,以及文件屬性,例如:主題、作者、標題和關鍵字。

對輸入 PDF 文件施加的限制會影響文件的匯入和處理。例如,如果不允許複製文字,則該 PDF 文件將無法處理。請確認您要處理的 PDF 檔案未受複製保護。

PDF 輸出

PDF 安全性與加密支援

ABBYY FineReader Engine 12 支援多種 PDF 安全性設定,進一步提升其在政府機關及其他對高安全性有嚴格要求之組織中的適用性。

  • 用於防止未經授權存取文件的「開啟檔案」密碼設定。
  • 透過設定權限密碼,限制列印、編輯或擷取檔案內容等特定操作。
  • 支援最新的加密標準。

intro_KeyFeatures_PDFConversion

以 Tagged PDF 格式輸出

Tagged PDF 可重新排版,以配合不同的頁面或螢幕寬度。非常適合搭配手持裝置 (PDA) 或視障使用者常用的螢幕閱讀器使用。

頁面大小

可在 PDF 轉換過程中設定輸出檔案所有頁面的大小

中繼資料匯出

ABBYY FineReader Engine 12 可匯出中繼資料 (書籤、超連結、交叉參照等) 。

轉換為 PDF/A 格式

可轉換為 PDF/A 格式;此格式建議作為長期保存頁面導向文件的標準。

ABBYY 的技術可將文件儲存為不同相容性等級的 PDF/A 格式:PDF/A-1a、PDF/A-1b、PDF/A-2a、PDF/A-2b、PDF/A-2u、PDF/A-3a、PDF/A-3b、PDF/A-3u。

PDF/A-1a 格式具有以下特點:可最佳保留文件格式、邏輯結構及一般外觀,並可在不同尺寸的顯示器上盡可能維持文件外觀 (為達成此目的,文件內容會以特定方式組織) 。

PDF/A-1b 格式僅用於重現文件外觀。

PDF/A-2a、PDF/A-2b 和 PDF/A-2u 格式支援 JPEG 2000 影像壓縮、透明度與圖層。差異在於 PDF/A-2u 中的所有文字皆具有 Unicode 對應。

PDF/A-3a、PDF/A-3b 和 PDF/A-3u 格式支援將任何格式的文件 (例如 Excel、Word、HTML、CAD、XML) 附加至 PDF 文件。

轉換為 PDF/UA 格式

ABBYY FineReader Engine 12 支援依照 PDF/UA 標準匯出為 PDF。PDF/UA 格式支援 Tagged PDF 和輔助技術。

CJK 匯出為 PDF

可將中文 (簡體和繁體) 、日文及韓文文件轉換為 PDF 格式。

PDF (PDF/A) MRC 壓縮

系統會使用一種稱為 MRC (Mixed Raster Content,混合光柵內容) 的特殊壓縮技術,以盡可能縮小 PDF 和 PDF/A 檔案的大小。 intro_KeyFeatures_PDFConversion2 文件影像檔通常很大,因為背景往往占檔案大小的 90%。然而,背景在產生的文件中未必是必要的,真正重要的是文字和圖片。 MRC 壓縮技術可找出彩色背景並將其刪除,或加以高度壓縮。如此一來,就能保留白色背景上的文字與圖片,進而縮小檔案大小。 圖片物件 (圖表、圖形、標誌、照片、繪圖、印章、簽名等) 也會稍微壓縮,但僅限於不會降低品質的程度。 MRC 技術會分析文件中相似字元的輪廓,建立平均字元範本,並以此取代原本的字元。這可提升可讀性,因為部分文字缺陷會被修正,而且字元輪廓也會更精確。 因此,您會得到更小、而且看起來甚至比原來更好的影像。產生的文件將具有低調且均勻的背景,以及清晰細緻的文字與圖片。 當您必須處理低品質影像,而原因包括光線不佳、照片失焦、掃描/拍照參數不正確、深色無塗層紙張或文件老化損壞時,這種對文件的「重建」就會很有幫助。 這些因素都會導致影像出現深色背景和額外的紋理,文字也會顯得模糊且難以閱讀。 MRC 技術可改善文件外觀,且檔案大小最多可比 JPEG 小 8 到 10 倍。

清晰簡潔的 PDF 轉換

ABBYY FineReader Engine 為開發人員提供專用工具,讓他們可依自身需求選擇最佳的 PDF 轉換模式
PDF 匯出情境說明
MaxQuality最佳化 PDF (PDF/A) 匯出,以獲得品質最佳的結果檔案。
BalancedPDF (PDF/A) 匯出會在結果檔案的品質、檔案大小與處理時間之間取得平衡。
MinSize最佳化 PDF (PDF/A) 匯出,以獲得最小的結果檔案大小。
MaxSpeed最佳化 PDF (PDF/A) 匯出,以獲得最快的處理速度。

另請參閱

主要功能