版本 7
安全性修正
預先定義設定檔
影像開啟與預處理
- 為加快影像準備速度,若已知文件型別,您可以設定文件的型別 (IPrepareImageMode::DocumentType) ,因此無需執行文件分類器。
- 新增輸入格式:HEIF、SVG、WebP。
- 新增適用於含有多個不同方向文字片段之工程圖的文件型別 (DocumentTypeEnum::DT_TechnicalDrawing) 。
匯出
- 現在可將從文件中擷取的資料匯出為 JSON 格式 (JsonExportParams) 。
OCR 與 ICR 改進
- 現在可在版面分析時偵測核取記號 (IPageAnalysisParams::DetectCheckmarks)
- 針對具有複雜版面配置和表格的文件提供特殊分析模式 (IPageAnalysisParams::AnalysisMode)
- 新增一項設定,可將印章儲存為圖片 (IPageAnalysisParams::DetectStamps)
- 除了仿印刷體之外,現在也可識別手寫文字,支援英文、西班牙文、法文、德文和日文 (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- 新增一個類似機率值的屬性,用於估算字元識別的準確度 (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Windows 程式碼範例
- 新增適用於 .NET Core 的 HelloBCR 範例
- 新增適用於 .NET Core 的 DataExtraction 範例
版本 5
新增與改良的語言識別
- 孟加拉語識別
- Windows 版的 Arabic_Amount 特殊語言識別
OCR 與 ICR 改進
- 現在可透過使用其他參數來執行名片合成 (IFRPage::SynthesizeBusinessCardEx、ISynthesisParamsForPage::BusinessCardSynthesisParams)
- 現在可使用新的 Accurate 識別模式 (IRecognizerParams::Mode)
- 新增可檢查是否存在條碼 (郵政條碼除外) 的屬性 (IBarcodeParams::EnableBarcodesCheck)
- 現在可使用常數 BT_AutodetectWithoutPostal 來偵測條碼類型 (郵政條碼除外) (BarcodeTypeEnum)
- ABBYY FineReader Engine 現在可識別日本郵政客戶代碼 (BarcodeTypeEnum、Barcode Types)
影像開啟與預處理
- 您現在可載入由先前支援版本的 ABBYY FineReader Engine 儲存的文件 (IFRDocument::ConvertFromOldVersion)
- 您可以取得文件是否包含數位簽章的相關資訊 (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- 現在可檢查文字層的可靠性 (IFRDocument::CheckTextLayer)
- 已改善處理數位原生 PDF 檔案的預設模式 (SourceContentReuseModeEnum::CRM_Auto)
- 現在可變更輸出 PDF 檔案的外觀 (ITextLayerInjectionParams::AllowChangePDFAView)
- 您現在可判斷並開啟 PDF Portfolio 類型的檔案 (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
匯出
- 匯出至 ALTO 現已支援 ALTO 4.0、4.1、4.2 版 (AltoVersionEnum)
- 新增將 fonts 內嵌至輸出 PDF 檔案的模式 (FontEmbeddingModeEnum)
- 新增可將使用者自訂圖片加入輸出 PDF 的介面 (IPDFPictures、IPDFPicture)
- Linux 和 macOS 現已提供用於文件匯出的 XLS 與 XPS 格式 (XLExportParams、XPSExportParams)
程式碼範例
- 新增適用於 .NET Core 的 Hello 範例
其他改進
- 您可以取得配置給文件物件的記憶體大小資訊 (IFRDocument::AllocatedSize)
- Linux 和 Windows 中新增了釋放線上授權的選項 (IEngine::ReleaseOnlineLicense、授權管理工具程式中的「Release Online Licenses…」)
- ABBYY FineReader Engine for Windows 安裝程式現在使用 Windows Installer XML Toolset (WiX)
- Windows 中新增了 LICENSEDATADIR 選項,可變更用來儲存輔助資訊的資料夾 (Installing the ABBYY FineReader Engine Library in Automatic Mode)
- ABBYY FineReader Engine 12 現在可在 Windows 的 Azure Services 中執行
- 您現在可以取得以已處理頁面數量為限制的授權續期日期 (ILicense::VolumeRefreshingDate)
- 新增了說明如何在 Linux 中以非 root 使用者身分執行 Licensing Service 的小節 (Installing the Licensing Service)
版本 4
特殊功能
- 您可以比較兩份文件或兩個頁面 (IComparator::CompareDocuments、IComparator::ComparePages)
- Document Comparison API 的方法可協助偵測文字差異 (IChange::GetAsTextChange) ,並將比較結果匯出為 XML 或 DOCX 格式 (IComparisonResult::Export)
- 在 Windows 中,您可以將使用 ABBYY ScanDifFinder SDK 的程式碼升級為採用 ABBYY FineReader Engine 中實作的 Document Comparison API (Migration Guide from ScanDifFinder SDK to Document Comparison API)
OCR 與 ICR 改進
- 新增支援的郵政條碼:KIX、Royal Mail 4-State、Australian Post 4-State (BarcodeTypeEnum、條碼類型)
影像開啟與預處理
- 文件版面配置可儲存至資料流,也可從資料流讀取 (ILayout::SaveToStream、IEngine::CreateLayoutFromStream) ,或儲存為位元組陣列 (ILayout::SaveToArray)
匯出
- 匯出為 PDF 支援設定頁面方向 (IPDFExportFeatures::PageOrientation)
- 匯出為 RTF 支援調整頁面邊距 (IRTFExportParams::PageMargins) ,並在內容無法完整容納於頁面時增大頁面尺寸 (IRTFExportParams::IncreasePaperSizeToFitContent)
- 匯出為 XLSX 支援在輸出文件中嵌入圖片 (IXLExportParams::WritePictures,IXLExportParams::PictureExportParams)
程式碼範例
- 新增 Document Comparison Windows 示範工具和 Document Comparison 範例。這些範例示範如何將一份文件或頁面與另一份文件或頁面進行比較。
- 已更新適用於 Linux 和 Windows 的 CommandLineInterface 範例。
- 新增適用於 macOS 的 CommandLineInterface 範例。此範例提供 ABBYY FineReader Engine 的命令列介面。
- 新增適用於 macOS 的 SAFEARRAY_Hello 範例。此範例示範如何使用 SAFEARRAY 型別進行文件處理。
其他改進
Linux 與 Windows
- 線上授權會限制單一工作站可使用的 CPU 核心數量。
- 線上授權現在要求在安裝了 Licensing Service 的電腦上使用 GoDaddy Trusted Root Certification Authority。
- Linux 的靜默安裝參數清單已更新。
版本 3
特殊功能
- 現在可從文件影像中擷取 MRZ (IFRPage::ExtractMrz)
- 從 MRZ 擷取的資料包含欄位與行 (MrzField、MrzData、MrzLine) ,其中含有關於文件及持有人的資訊,並可匯出為 XML 檔案 或 JSON 檔案
新增與改進的語言識別功能
- 喬治亞語識別
- 數學公式識別
影像開啟與預處理
- 您現在可以在 Linux 和 Windows 中,使用與開啟影像相同的方法來開啟數位原生文件;這些數位文件會先轉換,再載入其內容 (OfficeConversionSettings、OfficeConverters)
- 您可以在影像預處理期間設定二值化閾值 (
IPrepareImageMode::BinarizationThreshold) - 在 Linux 和 Windows 中,可於轉換輸入影像前設定在記憶體中處理文件頁面的模式 (IBatchProcessor::PageFlushingPolicy)
匯出
- 現在可檢視及變更建立日期與修改日期。此外,您也可以設定日期在輸出文件中的寫入方式 (DocumentContentInfo::CreationDate、DocumentContentInfo::ModificationDate、DocumentContentInfoWritingParams::WriteCreationDate、DocumentContentInfoWritingParams::WriteModificationDate) 。只有格式正確的日期才能寫入文件。如果匯出期間發生錯誤,請以正確格式指定日期,或變更其寫入模式,然後再次呼叫匯出方法 (Handling Errors During PDF/XPS Export)
- 輸出文件中的原始時間格式 (TimeZoneTypeEnum)
程式碼範例
- 新增適用於 Linux 和 Windows 的 MRZExtraction 範例。此範例示範如何從機器可讀區 (MRZ) 擷取資料
- 新增 Windows 程式碼範例,說明如何實作計時器,以便在方法呼叫耗時過久時中止處理
- 新增適用於 Linux 的 ICR 範例,示範如何從影像文件中辨識仿印刷體文字
其他改進
- 現在可按位置對資料區塊進行排序 (ILayout::SortedBlocks)
- ABBYY FineReader Engine 發行套件現已包含 End User License Agreement 檔案
Linux 與 Windows
- ABBYY FineReader Engine for Linux 現已支援 Amazon Linux AMI
- 線上授權不需要任何特定設定,但如果您想要透過代理伺服器使用授權,則必須設定其參數
- 線上授權現在可用於有限數量的連線,而該數量可在授權自主執行期限結束後變更
- ABBYY FineReader Engine 12 現在可於Docker 容器中執行
- 支援的 Java Development Kit 清單列於系統需求中
- ABBYY FineReader Engine 的組建編號現在可在模組載入前取得。您可在 ABBYY FineReader Engine 發行套件隨附的 JAR 檔案名稱中找到它
版本 2
特殊功能
- 更新後的分類技術支援根據影像特徵、已辨識文字的特性,或結合影像與文字特性進行分類 (ClassifierTypeEnum)
- 現已支援對文件和頁面進行分類 (IClassificationEngine::CreateObjectFromDocument、IClassificationEngine::CreateObjectFromPage)
- 可使用 k 折交叉驗證技術訓練新的分類模型 (ValidationParams) ,並提供模型效能的詳細資訊 (ValidationResult)
新增與改良的語言識別功能
- 支援緬甸語識別
- 已改良的日語 (現代) ,可更準確地識別可能包含部分拉丁字母或希臘語字母的日文文字。現在也可用於名片辨識
- 已更新波斯語 OCR
OCR 與 ICR 改進
- 現可取得所有字元辨識變體的座標 (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
影像開啟與預處理
- 現在可在預處理期間將影像自動裁切至文件邊緣 (IPagePreprocessingParams::CropImage)
- 可套用雜訊抑制濾鏡,以提升識別品質 (IImageDocument::ApplySigmaFilter)
- 可在影像中尋找作為定位錨點的黑色方塊 (IImageDocument::FindBlackSquares)
匯出
- 支援匯出為 PDF 2.0 版本格式
- 文字層插入支援已加標籤的 PDF 檔案,並且在 Windows 中支援符合 PDF/A 標準
- Windows 中的 PDF 匯出除了 RC4 之外,也支援 AES-256 加密,以及 PDF/A-2b 和 PDF/A-3b 相容性 (IPDFExportParams::PDFAComplianceMode)
- Linux 中的 PDF 匯出除了 RC4 和 AES-128 之外,也支援 AES-256 加密 (IPDFEncryptionInfo::EncryptionAlgorithm) ,以及 PDF/A-2b 和 PDF/A-3b 相容性 (IPDFExportParams::PDFAComplianceMode)
- 完整支援符合 ZUGFeRD 規範的 PDF:將 IPDFExportFeatures::EnableZugferdCompliance 設為 TRUE 匯出的文件,現在可通過官方 ZUGFeRD 驗證器
- 匯出至 Excel 支援由右至左的工作表方向 (IXLExportParams::CreateRtlSheets)
- 匯出至 ALTO 現在支援 ALTO 3.1 版 (IAltoExportParams::AltoVersion)
- RTF 匯出可透過停用分隔線篩選,在輸出中保留更多分隔線 (IRTFExportParams::FilterSeparators)
- 進一步支援 DOCX 點狀分隔線
- 支援 HTML 5.0 (HTMLFormatModeEnum 的 HFM_Format50 常數)
- 支援符合 PDF/UA 的文件 (IPDFExportFeatures::EnablePDFUACompliance)
- 匯出至 TXT 的進階版面配置模擬模式 (ITextExportParams::LayoutRetentionMode)
掃描 API (Windows)
- 現在可自動判斷紙張大小與掃描色彩模式 (ScanPaperSizeEnum::SPS_Auto、ScanColorModeEnum::SCM_Auto)
- 若掃描器支援這些功能,則可在掃描時自動略過空白頁面並校正影像傾斜 (IScanSourceSettings::DiscardBlankPages、IScanSourceSettings::CorrectSkew)
程式碼範例
- 新增程式碼範例,示範可對任何類型的文件進行 Classification (Windows) 及 Classification (Linux 和 macOS)
- 已更新適用於 Java 的 Windows EnginesPool 範例
- 新增適用於 C++ 和 Java 的 Linux 程式碼範例 Hello (Outproc) 與 Multithreading。這些範例示範如何將 Engine 以處理序外伺服器的形式載入至另一個獨立處理序中,以進行影像處理
- 新增 SAFEARRAY_Hello Linux 範例。此範例示範如何使用 SAFEARRAY 型別進行文件處理
Linux 和 Windows 的其他改進
- 在 Windows 中,現在有更簡單的方式可在多執行緒 Java 應用程式中使用 FineReader Engine (已將 EnginesPool 實作加入 Java wrapper)
- 已針對所有授權類型 (包括線上授權) 統一 Engine 載入程序,因此當您從一種授權類型切換到另一種時,無需重寫程式碼。請參閱 InitializeEngine 和 IEngineLoader::InitializeEngine (Windows)
- 現在可在 Linux 上使用 C++ 實作多執行緒應用程式
