このトピックは Windows 向け FRE に適用されます。
以下に、バージョン 5.0 から 11 までの機能概要を示します。
ABBYY FineReader Engine 5.0 の新機能 (リリース: 05/2001) |
|---|
- 認識品質がバージョン 4.0 と比べて 1.5~2 倍向上
- ページ レイアウトを完全に保持したまま HTML 形式および PDF 形式で保存
- テキストの色を完全に保持
- 下付き文字および単純な化学式の認識
- 縦書きテキストの認識、および表のセルに「埋め込まれた」画像の認識
- 見開きページの分割
| - プログラミング言語 Basic、C/C++、COBOL、Fortran、JAVA、Pascal を含む 176 の認識言語、および新しい言語辞書
- COM インターフェイスをサポートする任意の開発環境 (Visual Basic .NET、C/C++ など) から利用可能な Component Object Model (COM) API
- ユーザー言語および辞書を作成するための API
- FineReader のトレーニング ダイアログを使用して、機械印字文字用のユーザー パターンを学習させるためのツール
- VB Object Browser から直接アクセスできる、コンテキスト依存のトピックを備えた新しい HTML Help
|
ABBYY FineReader Engine 6.0 の新機能 (リリース: 08/2002) |
|---|
- 印字品質の低い文書の認識アルゴリズムを改良。改良されたアルゴリズムには、新しい適応型画像二値化メソッドと新しい背景除去メソッドが組み込まれており、特に「gray」モードでスキャンされた画像に効果的です
- 新しい PDF 保存モード — 「画像のみ」
- Excel 形式でテキストの配置を保存
- RTF 形式で非矩形の画像を保存し、箇条書きや番号付けを再現
- 177 の認識言語
| - 新しい認識フォントをサポート: OCR-A、OCR-B、および MICR (E13B)
- Fast モードは、FineReader 6.0 Engine Standard を除くすべての FineReader 6.0 Engine バージョンで利用できます。このモードでは、画質は低下するものの、より高速な認識が可能です
- ASCII バージョンの新機能: 画像ファイルの前処理、複数ページの画像ファイルの認識、メモリ イメージの処理
- 新しいライセンス マネージャー ユーティリティ
|
ABBYY FineReader Engine 7.0/7.1 の新機能 (リリース: 07/2004) |
|---|
- 認識精度が約 25% 向上
- PDF ファイルのオープンと処理に対応
- 新しい認識言語: 繁体字中国語、簡体字中国語、日本語
- 古いヨーロッパ言語を追加: 古英語、古フランス語、古ドイツ語、古イタリア語、古スペイン語
- フラクトゥール/ブラックレター書体の認識
- JPEG2000 Part 1 をサポート
- 複数ページの TIFF または PDF ファイルから、選択したページをオープン可能
- バーコードの解析と認識のための新しいメソッド
- 新しい種類の 1D バーコードをサポート: チェックサムなしの CODABAR、UCC Code 128、Industrial 2of5、IATA 2of5、Matrix 2of5、Code 93、UPC-A、UPC-E
- Microsoft Word XML および ASCII XML 出力
- MS PowerPoint へのエクスポート
- 請求書向け DA を改善。ページの向きの検出や、任意の角度にあるバーコードの検出を含む 1D バーコード検出に対応
| - 表の検出と解析を改善。特に、印刷された罫線のない表や、色付きの行や列がある表で改善
- 適応的二値化と背景フィルタリングを改善
- 新しい辞書を追加: 英語およびドイツ語向けの法律辞書と医学辞書
- 認識結果を線形化 PDF ファイルとして保存可能: ファイル全体のダウンロードが完了する前に、ユーザーは PDF の先頭ページを表示できます
- 編集済みテキストの PDF 形式での保存を改善
- HTML および RTF 形式へのエクスポートを大幅に改善
- ネットワーク runtime ライセンスを利用可能
- ABBYY FormReader および FlexiCapture をサポートし、フォームおよび半構造化文書の処理に対応
- ICR 向けの新しい認識言語: ハンガリー語、ギリシャ語、クロアチア語
- アラビア語 ICR 数字
- ICR 向け Fast Mode
|
ABBYY FineReader Engine 8.0/8.1 の新機能 (リリース: 09/2005) |
|---|
- Voting API をサポート
- field レベルの認識機能を強化: ICR 向け fast mode、下線付き field からのテキスト抽出の改善、テキストブロックのノイズ除去、スペースを含む field での認識結果向上、スペースを含む単語の辞書
- PDF/A をサポート
- 低解像度文書およびファクスで、最大 30% の精度向上
- デジタルカメラで撮影した文書で、最大 40% の精度向上
- デジタルカメラで撮影した画像のテキスト行を補正する機能
- 新しい入力画像形式 (GIF および DjVu)
- OCR 向け Balanced Processing Mode
- 全文索引作成向けの新しい Document Analysis
- PDF の処理と作成を改善。処理速度は最大 2 倍に向上し、精度向上、セキュリティオプションの強化、タグ付き PDF ファイル、PDF ページサイズの制御に対応
| - 新しいバーコード 型 — EAN 13 Supplemental をサポート
- CMC7 Text 型をサポート
- 外部辞書のサポートを追加
- フォームおよび半構造化文書の処理を改善
- 必要に応じて、または事前に Engine のサブシステムをロードする機能
- 認識された単語および文字について、考えられるすべての候補を取得する機能
- Engine の呼び出しを log file に記録する機能
- 「オンザフライ」でのコア認識チューニング
- OCR 向けの新しい言語: タイ語
- OCR 向けの新しい言語: ヘブライ語
- PDF および RTF エクスポート向けのアジア言語サポートを拡張
- Engine プロファイルへの外部データ保存
|
ABBYY FineReader Engine 9.0 の新機能 (リリース日: 10/2008)
-
ADRT で生成された文書は、文書全体をひとまとまりとして処理するため、すべてのページで書式が統一されます。
-
新しい API オブジェクトにより、ページと文書合成のパラメーターを個別に設定できます。
-
複数ページの文書の解析および認識時に、すべての CPU コアを活用します。
-
最大 20 度までの画像の回転を検出し、水平・垂直方向の黒い四角の組、線、テキスト行を基準に傾きを補正します。
-
開発者は、認識結果や文書の検証・確認機能に対して、ユーザーが直接アクセスできるようにしつつ、そのアクセスを適切に制御できます。
-
認識した文書を、Microsoft Office 2007 で導入された新しいオープンで相互運用性に優れた堅牢な XML ベース形式にエクスポートできます
-
MRC 圧縮により、文書の見た目を損なうことなく、大幅に高い圧縮率を実現します。ファイルサイズを大きく削減でき、JPEG 圧縮と比べて最大 10 分の 1 まで小さくできます。
-
新しいライセンス体系により、ページ数制限付きライセンスでもコア数を無制限に利用できます。
-
ページカウンターのない新しいライセンスも提供されます。この場合、価格は利用可能な CPU コアの最大数に基づいて決まります。
ABBYY FineReader Engine 10 の新機能 (リリース日: 08/2010)
-
ドキュメントマップと目次の作成、画像キャプションの処理、文書構造合成結果用の新しい API。
-
アラビア語に対応し、中国語、日本語、韓国語、タイ語、ヘブライ語、ベトナム語、旧ヨーロッパ言語の認識を改善。
-
画像の二値化、画像のカラー フィルタリング、写真の前処理を改善: 3D 遠近歪み補正、ぼけ補正、ISO ノイズ低減。
-
標準認識モードが高速化し、マルチコア対応も向上。
-
認識した文書を電子書籍形式にエクスポート可能。
-
ブラジル・ポルトガル語、韓国語、中国語 (中国) 、中国語 (台湾) 、デンマーク語、ギリシャ語。
-
少数のパラメーターを設定するだけで PDF (PDF/A) エクスポートをはるかに簡単に調整できるようになり、PDF MRC エクスポートも改善。
ABBYY FineReader Engine 11 の新機能 (リリース: 10/2013)
-
分類器 (カスタム文書特徴をサポート) をトレーニングし、それを使用して文書の種類を識別できます。
-
古代教会スラヴ語とペルシア語の認識に対応し、アラビア語、ラテン語、アゼルバイジャン語、ロシア語 (旧綴り) 、トルクメン語の認識を改善しました。ICR で新たに利用可能になった言語: デンマーク語、ノルウェー語 (ブークモール) 、ノルウェー語 (ニーノシュク) 、古英語、セルビア語 (キリル文字) 、タジク語。
-
中国語、日本語、韓国語を含むあらゆる言語でユーザー辞書を作成できます。
-
表の検出、全言語での縦書きテキストの検出、技術図面認識用の新しいプロファイル、文書合成で使用されるフォントへのアクセス、テキスト型の検出を改善しました。
-
ノイズ除去、コントラスト強調、自動トリミングとページ分割、PDF のテキストレイヤーの検出、PDF のラスタライズ解像度を指定する機能、PDF フォント名の抽出、カラーオブジェクトのフィルタリング、特殊な写真処理モード。
-
スキャナーの拡張プロパティへのアクセス、非同期スキャンモード、API 型および UI 型による利用可能なスキャナーのフィルタリング。
-
大容量文書のエクスポート対応、並列プロセスでのエクスポート、PDF/A 準拠のエクスポート形式、線形化 PDF ファイルのサポート、テキストレイヤーの挿入、PDF 添付ファイルのエクスポート。
-
新しい XPS エクスポート形式、PPTX、RTF、DOCX、XLSX、HTML、XML、TXT、EPUB、FB2 の各形式向けのさまざまな新しいエクスポート機能。
-
MaxiCode、Code 32、Full ASCII Code 39、Intelligent Mail のバーコード型、高度なバーコード検出モード、速度に最適化された新しいバーコード認識プロファイル、低品質バーコードの検出。
-
冗長ライセンスサーバー構成のサポート、ライセンスサーバー接続エラーへの対応。
-
レイアウトのクリーンアップ、バッチ処理の制御、オブジェクト数の追跡、空白ページの検出など。