リリース7
セキュリティ修正
定義済みプロファイル
画像の読み込みと前処理
- 画像の準備を高速化するため、文書タイプ (IPrepareImageMode::DocumentType) がわかっている場合は設定できます。これにより、文書分類器を実行する必要がなくなります。
- 新しい入力フォーマット: HEIF、SVG、WebP。
- さまざまな方向の多数のテキスト断片を含む技術図面用の文書タイプ (DocumentTypeEnum::DT_TechnicalDrawing) 。
エクスポート
- 文書から抽出したデータを、JsonExportParams を使用して JSON 形式でエクスポートできるようになりました。
OCR と ICR の改善
- レイアウト解析時にチェックマークを検出できるようになりました (IPageAnalysisParams::DetectCheckmarks)
- 複雑なレイアウトや表を含む文書向けの特別な解析モード (IPageAnalysisParams::AnalysisMode)
- スタンプを画像として保存できる新しい設定が追加されました (IPageAnalysisParams::DetectStamps)
- 英語、スペイン語、フランス語、ドイツ語、日本語では、活字体に加えて手書き文字も認識できるようになりました (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- 文字認識の精度を推定する、新しい確率的なプロパティ (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Windows向けコードサンプル
- .NET Core向けの新しい HelloBCR サンプル
- .NET Core向けの新しい DataExtraction サンプル
リリース 5
新規対応および改善された言語認識
- ベンガル語認識
- Windows での Arabic_Amount 特殊言語認識
OCR と ICR の改善
- 追加のパラメーターを使用して名刺の合成を実行できるようになりました (IFRPage::SynthesizeBusinessCardEx、ISynthesisParamsForPage::BusinessCardSynthesisParams)
- 新しい Accurate 認識モード (IRecognizerParams::Mode) を使用できるようになりました
- 郵便用を除くバーコードの有無を確認するための新しいプロパティが追加されました (IBarcodeParams::EnableBarcodesCheck)
- 定数 BT_AutodetectWithoutPostal を使用して、郵便用を除くバーコードの種類を検出できるようになりました (BarcodeTypeEnum)
- ABBYY FineReader Engine で日本の郵便カスタマーコードを認識できるようになりました (BarcodeTypeEnum、Barcode Types)
画像の読み込みと前処理
- 従来サポートされていたバージョンの ABBYY FineReader Engine で保存された文書を読み込めるようになりました (IFRDocument::ConvertFromOldVersion)
- 文書にデジタル署名が含まれているかどうかの情報を取得できるようになりました (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- テキストレイヤー の信頼性を確認できるようになりました (IFRDocument::CheckTextLayer)
- デジタル生成 PDF ファイルの処理における既定モードが改善されました (SourceContentReuseModeEnum::CRM_Auto)
- 出力 PDF ファイルの外観を変更できるようになりました (ITextLayerInjectionParams::AllowChangePDFAView)
- PDF Portfolio ファイルを判別して開けるようになりました (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
エクスポート
- ALTO へのエクスポートで、ALTO バージョン 4.0、4.1、4.2 がサポートされるようになりました (AltoVersionEnum)
- 出力 PDF ファイルでのフォント埋め込みに、新しいモードが追加されました (FontEmbeddingModeEnum)
- 出力 PDF にユーザー定義の画像を追加するための新しいインターフェイスが追加されました (IPDFPictures, IPDFPicture)
- Linux および macOS で、文書を XLS 形式および XPS 形式でエクスポートできるようになりました (XLExportParams, XPSExportParams)
コードサンプル
- .NET Core 用の新しい Hello サンプル
その他の改善点
- ドキュメント オブジェクトに割り当てられたメモリ サイズの情報を取得できるようになりました (IFRDocument::AllocatedSize)
- Linux と Windows で、オンライン ライセンスを解放するための新しいオプション (IEngine::ReleaseOnlineLicense、License Manager utility の「Release Online Licenses…」) が追加されました
- Windows 用 ABBYY FineReader Engine インストーラーで、Windows Installer XML Toolset (WiX) が使用されるようになりました
- Windows で、補助情報の保存に使用するフォルダーを変更するための新しい LICENSEDATADIR オプションが追加されました (Installing the ABBYY FineReader Engine Library in Automatic Mode)
- Windows で、ABBYY FineReader Engine 12 を Azure Services 上で実行できるようになりました
- 処理ページ数に関するライセンス制限の更新日を取得できるようになりました (ILicense::VolumeRefreshingDate)
- Linux で、非 root ユーザーとして Licensing Service を実行する方法を説明する新しいサブセクションが追加されました (Installing the Licensing Service)
リリース4
特長
- 2つの文書または2つのページを比較できます (IComparator::CompareDocuments、IComparator::ComparePages)
- Document Comparison API のメソッドを使用すると、テキストの変更を検出し (IChange::GetAsTextChange) 、比較結果を XML または DOCX 形式でエクスポートできます (IComparisonResult::Export)
- Windows では、ABBYY ScanDifFinder SDK を使用したコードを、ABBYY FineReader Engine に実装された Document Comparison API を使用するコードに移行できます (Migration Guide from ScanDifFinder SDK to Document Comparison API)
OCR および ICR の改善
- 新たに対応した郵便バーコード: KIX、Royal Mail 4-State、Australian Post 4-State (BarcodeTypeEnum、バーコードの種類)
画像の読み込みと前処理
- ドキュメントのレイアウトは、ストリームへの保存とストリームからの読み込み (ILayout::SaveToStream、IEngine::CreateLayoutFromStream) に対応しており、バイト配列として保存することもできます (ILayout::SaveToArray)
エクスポート
- PDF へのエクスポートでは、ページの向きを設定できます (IPDFExportFeatures::PageOrientation)
- RTF へのエクスポートでは、ページ余白の調整 (IRTFExportParams::PageMargins) や、内容がページに収まらない場合のページサイズの拡大 (IRTFExportParams::IncreasePaperSizeToFitContent) が可能です
- XLSX へのエクスポートでは、出力文書に画像を埋め込むことができます (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
コードサンプル
- Windows 向けの新しい Document Comparison デモツールと Document Comparison サンプル。これらのサンプルでは、あるドキュメントまたはページを別のドキュメントやページと比較する方法を紹介しています。
- Linux および Windows 向けの CommandLineInterface サンプルを更新しました。
- macOS 向けの新しい CommandLineInterface サンプル。このサンプルでは、ABBYY FineReader Engine のコマンドラインインターフェイスを利用できます。
- macOS 向けの新しい SAFEARRAY_Hello サンプル。このサンプルでは、SAFEARRAY 型を使用したドキュメント処理を紹介しています。
その他の改善点
Linux および Windows
- オンライン ライセンスでは、1 台のワークステーションで使用できる CPU コア数が制限されます。
- オンライン ライセンスでは、Licensing Service がインストールされているコンピューターで GoDaddy Trusted Root Certification Authority の使用が必要になりました。
- Linux 向けに、サイレント インストール用パラメーター一覧が更新されました。
リリース 3
特長
- 文書画像から MRZ を抽出できるようになりました (IFRPage::ExtractMrz)
- MRZ から抽出されたデータには、文書とその所持者に関する情報を含む field と行 (MrzField、MrzData、MrzLine) が含まれており、XML file または JSON file にエクスポートできます
新たに強化された言語認識
- ジョージア語の認識
- 数式言語の認識
画像の読み込みと前処理
- Linux と Windows で、画像を開く場合と同じメソッドを使用して電子文書を開けるようになりました。電子文書は変換され、その内容が読み込まれます (OfficeConversionSettings、OfficeConverters)
- 画像の前処理時に二値化しきい値を設定できます (IPrepareImageMode::BinarizationThreshold)
- Linux と Windows では、入力画像の変換前に、メモリ上で文書ページを扱うモードを設定できます (IBatchProcessor::PageFlushingPolicy)
エクスポート
- 作成日と変更日を表示および変更できるようになりました。また、出力ドキュメントに日付を書き込む際のモードも設定できます (DocumentContentInfo::CreationDate、DocumentContentInfo::ModificationDate、DocumentContentInfoWritingParams::WriteCreationDate、DocumentContentInfoWritingParams::WriteModificationDate) 。ドキュメントに書き込めるのは、正しい形式の日付のみです。エクスポート中にエラーが発生した場合は、日付を正しい形式で指定するか、書き込みモードを変更してから、再度 export メソッドを呼び出してください (PDF/XPS エクスポート時のエラー処理)
- 出力ドキュメントで元の時刻形式を使用 (TimeZoneTypeEnum)
コードサンプル
- Linux および Windows 向けの新しい MRZExtraction サンプル。機械読取領域 (MRZ) からデータを抽出する方法を示します
- タイマーの実装方法 を紹介する新しい Windows 向けコードサンプル。メソッド呼び出しに時間がかかりすぎる場合に処理を中止できます
- Linux 向けの新しい ICR サンプル。画像ドキュメント内の手書き文字を認識する方法を示します
その他の改善点
- データブロックを位置順に並べ替えられるようになりました (ILayout::SortedBlocks)
- エンドユーザー使用許諾契約書のファイルが、ABBYY FineReader Engine Distribution Kit に含まれるようになりました
Linux および Windows
- Linux 向け ABBYY FineReader Engine で Amazon Linux AMI がサポートされるようになりました
- オンライン ライセンスには特別な設定は不要ですが、プロキシ サーバー経由でライセンスを使用する場合は、パラメーターを設定する必要があります
- オンライン ライセンスで使用できる接続数を制限できるようになりました。また、その接続数はライセンスの自律実行期間の終了後に変更できます
- ABBYY FineReader Engine 12 を Docker コンテナー内で実行できるようになりました
- サポートされている Java Development Kits の一覧は、システム要件に記載されています
- ABBYY FineReader Engine のビルド番号をモジュールの読み込み前に確認できるようになりました。ABBYY FineReader Engine Distribution Kit に含まれる JAR ファイル名で確認できます
リリース2
特長
- 更新された分類技術により、画像の特徴、認識されたテキストの特性、または画像とテキストの特性を組み合わせて分類できるようになりました (ClassifierTypeEnum)
- ドキュメントとページの両方で分類を利用できるようになりました (IClassificationEngine::CreateObjectFromDocument、IClassificationEngine::CreateObjectFromPage)
- 新しい分類モデルは、k 分割交差検証を使用してトレーニングでき、モデルの性能に関する詳細情報も確認できます (ValidationParams、ValidationResult)
新規追加および改善された言語認識
- ビルマ語の認識
- 一部にラテン文字やギリシャ文字を含む日本語テキストの認識精度を向上させるため、日本語 (現代) 言語を改善しました。これにより、Business Card Recognition でも利用できるようになりました
- ファルシー語のOCRを更新
OCR と ICR の改善
- すべての文字認識バリアントについて、座標を利用できます (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
画像の読み込みと前処理
- 前処理時に、画像をドキュメントの境界に合わせて自動的にトリミングできるようになりました (IPagePreprocessingParams::CropImage)
- ノイズ低減フィルターを適用して、認識品質を向上できるようになりました (IImageDocument::ApplySigmaFilter)
- 画像上の位置合わせ用の黒い四角を検出できるようになりました (IImageDocument::FindBlackSquares)
エクスポート
- PDF version 2.0 のエクスポートをサポート
- テキストレイヤーの挿入で、タグ付き PDF ファイルをサポートし、Windows では PDF/A 標準への準拠にも対応
- Windows での PDF エクスポートでは、RC4 に加えて AES-256 暗号化、PDF/A-2b および PDF/A-3b 準拠をサポート (IPDFExportParams::PDFAComplianceMode)
- Linux での PDF エクスポートでは、RC4 および AES-128 に加えて AES-256 暗号化 (IPDFEncryptionInfo::EncryptionAlgorithm) と、PDF/A-2b および PDF/A-3b 準拠をサポート (IPDFExportParams::PDFAComplianceMode)
- ZUGFeRD 準拠 PDF を完全サポート: IPDFExportFeatures::EnableZugferdCompliance を TRUE に設定してエクスポートした文書が、正式な ZUGFeRD バリデーターに合格するようになりました
- Excel へのエクスポートで、ワークシートの右から左への方向をサポート (IXLExportParams::CreateRtlSheets)
- ALTO へのエクスポートで、ALTO version 3.1 をサポート (IAltoExportParams::AltoVersion)
- RTF エクスポートでは、区切り線のフィルタリングを無効にすることで、出力でより多くの区切り線を保持可能 (IRTFExportParams::FilterSeparators)
- DOCX の点線区切り線のサポートを改善
- HTML 5.0 をサポート (HTMLFormatModeEnum の HFM_Format50 定数)
- PDF/UA 準拠文書をサポート (IPDFExportFeatures::EnablePDFUACompliance)
- TXT へのエクスポート向けに高度な Layout エミュレーションモードを追加 (ITextExportParams::LayoutRetentionMode)
Scanning API (Windows)
- 用紙サイズとスキャン時のカラーモードを自動的に判定できるようになりました (ScanPaperSizeEnum::SPS_Auto、ScanColorModeEnum::SCM_Auto)
- スキャナーがこれらの機能に対応している場合、スキャン時に空白ページをスキップし、画像の傾きを自動補正できるようになりました (IScanSourceSettings::DiscardBlankPages、IScanSourceSettings::CorrectSkew)
コードサンプル
- 任意の種類の文書を分類する新しいコードサンプル (Windows) と、分類する新しいコードサンプル (Linux および macOS)
- Java 向け Windows EnginesPool サンプルを更新
- C++ および Java 向けの新しい Linux コードサンプル Hello (Outproc) と Multithreading。これらのサンプルでは、エンジンを別プロセスにアウトプロセス サーバーとして読み込んだ状態での画像処理を紹介しています
- 新しい Linux サンプル SAFEARRAY_Hello。このサンプルでは、SAFEARRAY 型を使用した文書処理を紹介しています
Linux および Windows におけるその他の改善点
- Windows で マルチスレッド Java アプリケーションで FineReader Engine を使用するための、より簡単な方法 (Java ラッパーに EnginesPool 実装を追加)
- オンライン ライセンスを含むすべてのライセンス種別で Engine の読み込み手順を統一したため、あるライセンス種別から別のライセンス種別に切り替える際にもコードを書き換える必要がなくなりました。InitializeEngine および IEngineLoader::InitializeEngine を参照してください (Windows)
- Linux で、マルチスレッド アプリケーションを C++ で実装できるようになりました
