- スキャン画像または写真の前処理
- MRZ からのデータ抽出
- 外部ファイルへのエクスポート
シナリオの実装
このトピックで示すコードサンプルは、Windows 専用です。
ステップ 1. ABBYY FineReader Engine の読み込み
ステップ 1. ABBYY FineReader Engine の読み込み
ABBYY FineReader Engine の使用を開始するには、Engine オブジェクトを作成する必要があります。Engine オブジェクトは、ABBYY FineReader Engine オブジェクト階層の最上位に位置するオブジェクトで、さまざまなグローバル設定、一部の処理メソッド、および他のオブジェクトを作成するためのメソッドを提供します。Engine オブジェクトを作成するには、InitializeEngine 関数を使用できます。あわせて Engine オブジェクトを読み込むその他の方法 (Win) も参照してください。
C#
ステップ 2. シナリオ用の設定を読み込む
ステップ 2. シナリオ用の設定を読み込む
このシナリオに適した処理設定は、Engine オブジェクトの LoadPredefinedProfile メソッドを使用して読み込めます。このメソッドは、設定プロファイル名を入力パラメーターとして使用します。詳細については、Working with Profiles を参照してください。このシナリオの設定は、定義済みプロファイル MachineReadableZone で利用できます。処理設定を変更する場合は、適切な Parameter オブジェクトを使用してください。詳細については、以下の Additional optimization for specific tasks を参照してください。MRZ キャプチャは、お使いの ABBYY FineReader Engine のライセンスが MRZCapture モジュールをサポートしている場合にのみ使用できます。
- 画像上のすべてのテキストの検出と抽出を有効にします (画像、ベクターグラフィックス、表は検出されません) 。
- 解像度補正と幾何補正は自動的に実行されます。
C#
ステップ 3. ドキュメント画像の読み込みと前処理
ステップ 3. ドキュメント画像の読み込みと前処理
FineReader Engine に画像を読み込むには、次のオブジェクトのメソッドを使用できます。FRDocument オブジェクトに画像を読み込むには、次のいずれかを行います。
- FRDocument
- Linux および Windows 向けの BatchProcessor
Linux および Windows のユーザーは、各アプローチの利点と欠点について Parallel Processing with ABBYY FineReader Engine で確認できます。このトピックでは FRDocument に焦点を当てます。
- FRDocument オブジェクトの作成時に、Engine オブジェクトの CreateFRDocumentFromImage メソッドを使用します。
- 作成した FRDocument オブジェクトにファイルから画像を追加します (AddImageFile、AddImageFileWithPassword、または AddImageFileWithPasswordCallback メソッドを使用) 。
C#
ステップ 4. MRZ からのデータ抽出
ステップ 4. MRZ からのデータ抽出
MRZ からデータを抽出するには、次の手順に従います。
- [任意] Engine オブジェクトの CreateMrzProcessingParams メソッドを使用して、MrzProcessingParams オブジェクトを作成します。必要に応じて、そのプロパティを設定します。
- FRPage オブジェクトの ExtractMrz メソッドを呼び出し、前の手順で設定した MrzProcessingParams オブジェクトを入力パラメーターとして渡します。既定の MRZ 取得設定を使用する場合は、NULL を渡すだけでかまいません。取得した MRZ から解析された情報を含む MrzData オブジェクトが返されます。
C#
ステップ 5. 抽出したデータの操作
ステップ 5. 抽出したデータの操作
MrzData オブジェクトには、MRZ から抽出されたすべてのデータが含まれています。GetLine メソッドを使用すると機械可読テキストの行にアクセスでき、GetField メソッドおよび GetFieldByType メソッドを使用すると field を順に処理できます。抽出される field の type は次のとおりです。
- 文書の種類
- 文書のサブタイプ
- 発行国
- 姓
- 名
- 文書番号
- 国籍
- 生年月日
- 性別
- 有効期限
- 個人番号
- 任意データ行 1
- 任意データ行 2
C#
ステップ 6. 抽出データのエクスポート
ステップ 6. 抽出データのエクスポート
抽出データは XML ファイルまたは JSON ファイルとして保存できます。既定のパラメーターでデータをエクスポートするには、MrzData オブジェクトの ExportToFile メソッドを呼び出し、入力パラメーターとしてファイルのパスを渡します。ユーザー定義のパラメーターでデータをエクスポートするには、MrzData オブジェクトの ExportToFileEx メソッドを呼び出し、入力パラメーターとして MrzJsonExportParams オブジェクトまたは MrzXmlExportParams オブジェクトへのポインターを渡します。C#
ステップ 7. ABBYY FineReader Engine のアンロード
ステップ 7. ABBYY FineReader Engine のアンロード
ABBYY FineReader Engine での作業が完了したら、Engine オブジェクトをアンロードする必要があります。これを行うには、エクスポート関数 DeinitializeEngine を使用します。
C#
必要なリソース
追加の最適化
- Engine の読み込み
- Windows 向けのEngine オブジェクトを読み込むさまざまな方法
Engine オブジェクトの読み込み方法について詳しく説明しています。 - Windows 向けのマルチスレッドのサーバーアプリケーションで ABBYY FineReader Engine を使用する
サーバーアプリケーションで FineReader Engine を使用する際の特有の注意点を説明しています。 - プロファイルの操作
定義済みプロファイルとユーザープロファイルについて詳しく説明しています。
- Windows 向けのEngine オブジェクトを読み込むさまざまな方法
- 認識
- 前処理、解析、認識、および合成のパラメーターの調整
前処理、解析、認識、および合成の各パラメーターオブジェクトを使用して文書処理をカスタマイズする方法を説明します。
- 前処理、解析、認識、および合成のパラメーターの調整
- 抽出されたデータの操作
- 機械読取領域の field
ABBYY FineReader Engine 12 を使用して機械読取領域から抽出できる field の一覧と、その概要を示します。 - Text の操作
認識されたテキスト、段落、単語、および文字の操作方法を説明します。 - Voting API の使用
単語および文字認識の候補の操作方法を説明します。
- 機械読取領域の field
