メインコンテンツへスキップ
開発者が ABBYY FineReader Engine をより効果的に活用し、コアレベルで認識処理を操作できるようにする便利なツール:

プロファイルの利用

ABBYY FineReader Engine 12 には、基本的な使用シナリオ向けにあらかじめ最適化された定義済みプロファイルのセットが用意されています。これらのプロファイルで指定された設定により、それぞれの状況で最適な結果が得られます。また、ほとんどのプロファイルは 2 種類用意されており、1 つは生成される文書の品質を最優先に最適化した設定、もう 1 つは最高の処理速度を優先して最適化した設定です。以下に、利用可能な定義済みプロファイルの一覧を示します。

シナリオ

プロファイル名

データ抽出

  • DataExtraction

コンテンツ再利用のための文書変換

  • DocumentConversion_Accuracy
  • DocumentConversion_Normal

文書アーカイブ

  • DocumentArchiving_Accuracy
  • DocumentArchiving_Speed

field の検出および文書分類のためのテキスト抽出

  • TextExtraction_Accuracy
  • TextExtraction_Speed

field レベルの認識

  • FieldLevelRecognition

バーコード認識

  • BarcodeRecognition_Accuracy
  • BarcodeRecognition_Speed

名刺認識

  • BusinessCardsProcessing

機械可読領域からのデータ取得

  • MachineReadableZone

高圧縮 PDF 形式での文書アーカイブ

  • HighCompressedImageOnlyPdf

技術図面認識

  • EngineeringDrawingsProcessing
これらのプロファイルで提供される設定の一覧は、Predefined Profiles Specificationで確認できます。
これらのプロファイルで提供される設定は、Engine object の LoadPredefinedProfile メソッドを使用して読み込むことができます。プロファイルを読み込むと、新しく作成されるオブジェクトには、そのプロファイルで指定された新しい既定値が設定されます。

Voting API のサポート

ABBYY FineReader Engine をサードパーティ製アプリケーションで認識処理に参加するエンジンの 1 つとして使用する場合、文字、単語、および文字間の分離について、対応する信頼度レベル付きの認識候補 (または仮説) が提供されます。この情報は、複数の認識技術を必要とするアプリケーション向けに、効率的で高精度な投票アルゴリズムを設計する際に役立ちます。たとえば、“O” を認識する場合、ABBYY FineReader Engine は 3 つの仮説を返すことがあります。具体的には、信頼度 60 の “0” (ゼロ) 、信頼度 80 の大文字の “O”、信頼度 10 の大文字の “C” です。文字間の分離については、たとえば次のようなケースがあります。“m” に対する仮説として考えられるのは、“m”、“rn”、“in” です。詳細は Using Voting API を参照してください。

コア認識の「オンザフライ」調整

ABBYY FineReader では、開発者が Optical Character Recognition (OCR) の処理中に、認識エンジンへコアレベルでアクセスして制御できます。FineReader の認識エンジンは仮説 (または認識候補) を生成し、開発者は独自のランキング基準を使用して、各仮説の信頼度レベルの設定の処理に影響を与えたり微調整したり (または最適な仮説を選択したり) できます。

一般的な変換タスク向けのコードサンプル

SDK には、さまざまなシナリオで Engine を使用する方法を示すソースコードサンプル一式が付属しています。Windows 向けのコードサンプルは、Visual Basic .NET、raw C++、Native COM Support を使用する C++、C#、Java、およびスクリプト言語向けに用意されています。

関連情報

主な機能