このシナリオは、文書から可能な限り多くのデータを抽出し、構造化された形で保存するために使用されます。
結果として、文書構造を表す JSON ファイルが生成されます。このファイルには、印字文字や手書き文字のテキスト、表、バーコード、チェックマーク、画像など、文書内のすべてのオブジェクトが、それぞれの位置情報と属性とともに格納されます。この形式は、後続の処理、データベースへの保存、または他のアプリケーションとの統合に最適です。
このシナリオでは、文書は複数の処理ステップを経ます。
- スキャン画像または写真の前処理
スキャナーやデジタルカメラで取得した画像は、光学認識を行う前に調整が必要になる場合があります。たとえば、ノイズの多い画像やテキスト行がゆがんだ画像では、光学認識を正しく行うために補正が必要です。
- 文書上のすべてのデータを構造化された形で抽出
レイアウト解析では、画像上のさまざまなオブジェクトが検出され、対応する種類のブロックに分類されます。各ブロックは、その種類に最適な設定で認識されます。合成の過程では、文書の論理構造が一貫した形で復元されます。複雑なレイアウトであっても、テキストの順序は人が読む順序に近い形で維持されます。これにより、同じ文書を再認識した場合でも、同じ順序でテキストが得られます。
- 構造化形式へのエクスポート
認識された文書は JSON または XML として保存されます。
このトピックで提供するコードサンプルは、Windows 専用です。
以下では、ABBYY FineReader Engine 12を使用してドキュメントからデータを抽出するための推奨される方法について詳しく説明します。この方法では、この用途に最も適した処理設定を使用します。
手順 1. ABBYY FineReader Engine を読み込む
ABBYY FineReader Engine を使用するには、まず Engine オブジェクトを作成する必要があります。Engine オブジェクトは ABBYY FineReader Engine のオブジェクト階層における最上位のオブジェクトであり、各種グローバル設定、一部の処理メソッド、およびその他のオブジェクトを作成するためのメソッドを提供します。Engineオブジェクトを作成するには、InitializeEngine関数を使用します。Engineオブジェクトを読み込むその他の方法 (Win) も参照してください。public class EngineLoader : IDisposable
{
public EngineLoader()
{
// FREngine.dll へのフルパス、Customer Project ID、
// および該当する場合はオンライン ライセンス トークン ファイルへのパスとオンライン ライセンス パスワードを使用して、これらの変数を初期化します
string enginePath = "";
string customerProjectId = "";
string licensePath = "";
string licensePassword = "";
// FREngine.dll ライブラリを読み込みます
dllHandle = LoadLibraryEx(enginePath, IntPtr.Zero, LOAD_WITH_ALTERED_SEARCH_PATH);
try
{
if (dllHandle == IntPtr.Zero)
{
throw new Exception("読み込めません: " + enginePath);
}
IntPtr initializeEnginePtr = GetProcAddress(dllHandle, "InitializeEngine");
if (initializeEnginePtr == IntPtr.Zero)
{
throw new Exception("InitializeEngine 関数が見つかりません");
}
IntPtr deinitializeEnginePtr = GetProcAddress(dllHandle, "DeinitializeEngine");
if (deinitializeEnginePtr == IntPtr.Zero)
{
throw new Exception("DeinitializeEngine 関数が見つかりません");
}
IntPtr dllCanUnloadNowPtr = GetProcAddress(dllHandle, "DllCanUnloadNow");
if (dllCanUnloadNowPtr == IntPtr.Zero)
{
throw new Exception("DllCanUnloadNow 関数が見つかりません");
}
// ポインターをデリゲートに変換します
initializeEngine = (InitializeEngine)Marshal.GetDelegateForFunctionPointer(
initializeEnginePtr, typeof(InitializeEngine));
deinitializeEngine = (DeinitializeEngine)Marshal.GetDelegateForFunctionPointer(
deinitializeEnginePtr, typeof(DeinitializeEngine));
dllCanUnloadNow = (DllCanUnloadNow)Marshal.GetDelegateForFunctionPointer(
dllCanUnloadNowPtr, typeof(DllCanUnloadNow));
// InitializeEngine 関数を呼び出します
// オンライン ライセンス ファイルへのパスとオンライン ライセンス パスワードを渡します
int hresult = initializeEngine(customerProjectId, licensePath, licensePassword,
"", "", false, ref engine);
Marshal.ThrowExceptionForHR(hresult);
}
catch (Exception)
{
// FREngine.dll ライブラリを解放します
engine = null;
// FreeLibrary 呼び出し前にすべてのオブジェクトを削除します
GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
FreeLibrary(dllHandle);
dllHandle = IntPtr.Zero;
initializeEngine = null;
deinitializeEngine = null;
dllCanUnloadNow = null;
throw;
}
}
// Kernel32.dll 関数
[DllImport("kernel32.dll")]
private static extern IntPtr LoadLibraryEx(string dllToLoad, IntPtr reserved, uint flags);
private const uint LOAD_WITH_ALTERED_SEARCH_PATH = 0x00000008;
[DllImport("kernel32.dll")]
private static extern IntPtr GetProcAddress(IntPtr hModule, string procedureName);
[DllImport("kernel32.dll")]
private static extern bool FreeLibrary(IntPtr hModule);
// FREngine.dll 関数
[UnmanagedFunctionPointer(CallingConvention.StdCall, CharSet = CharSet.Unicode)]
private delegate int InitializeEngine(string customerProjectId, string licensePath,
string licensePassword, string tempFolder, string dataFolder, bool isSharedCPUCoresMode,
ref FREngine.IEngine engine);
[UnmanagedFunctionPointer(CallingConvention.StdCall)]
private delegate int DeinitializeEngine();
[UnmanagedFunctionPointer(CallingConvention.StdCall)]
private delegate int DllCanUnloadNow();
// プライベート変数
private FREngine.IEngine engine = null;
// FREngine.dll へのハンドル
private IntPtr dllHandle = IntPtr.Zero;
private InitializeEngine initializeEngine = null;
private DeinitializeEngine deinitializeEngine = null;
private DllCanUnloadNow dllCanUnloadNow = null;
}
C++ (COM)
// これらの変数を FREngine.dll へのパス、FineReader Engine の Customer Project ID、
// および該当する場合はオンライン ライセンス トークンとオンライン ライセンス パスワードへのパスで初期化してください
wchar_t* FreDllPath;
wchar_t* CustomerProjectId;
wchar_t* LicensePath; // オンライン ライセンスを使用しない場合は、これらの変数に空の文字列を設定してください
wchar_t* LicensePassword;
// FREngine.dll へのハンドル
static HMODULE libraryHandle = 0;
// グローバル FineReader Engine オブジェクト
FREngine::IEnginePtr Engine;
void LoadFREngine()
{
if( Engine != 0 ) {
// 読み込み済み
return;
}
// ステップ 1: FREngine.dll を読み込む
if( libraryHandle == 0 ) {
libraryHandle = LoadLibraryEx( FreDllPath, 0, LOAD_WITH_ALTERED_SEARCH_PATH );
if( libraryHandle == 0 ) {
throw L"ABBYY FineReader Engine の読み込み中にエラーが発生しました";
}
}
// ステップ 2: Engine オブジェクトを取得する
typedef HRESULT ( STDAPICALLTYPE* InitializeEngineFunc )( BSTR, BSTR, BSTR, BSTR,
BSTR, VARIANT_BOOL, FREngine::IEngine** );
InitializeEngineFunc pInitializeEngine =
( InitializeEngineFunc )GetProcAddress( libraryHandle, "InitializeEngine" );
if( pInitializeEngine == 0 || pInitializeEngine( CustomerProjectId, LicensePath,
LicensePassword, L"", L"", VARIANT_FALSE, &Engine ) != S_OK ) {
UnloadFREngine();
throw L"ABBYY FineReader Engine の読み込み中にエラーが発生しました";
}
}
ABBYY FineReader Engine では、Engine オブジェクトの LoadPredefinedProfile メソッドを使用して、このシナリオに最適なすべての処理設定を読み込めます。このメソッドは、入力パラメーターとしてプロファイル名を受け取ります。詳細については、Working with Profiles を参照してください。このシナリオの設定は、定義済みプロファイル DataExtraction で利用できます。
- レイアウト解析と認識では、速度よりも精度が優先されます。
- 手書き文字や、品質の低い小さなテキスト領域を含め、画像上のすべてのテキストを検出します。
- 表、チェックマーク、バーコードを検出します。
- 文書の論理構造を完全に再構成します。
// 定義済みプロファイルを読み込む
engine.LoadPredefinedProfile("DataExtraction");
// 定義済みプロファイルを読み込む
Engine->LoadPredefinedProfile( L"DataExtraction" );
処理設定を変更する場合は、対応する Parameter オブジェクトを使用します。詳細については、以下の Additional optimization セクションを参照してください。
ABBYY FineReader Engine には、複数ページの文書を処理できる FRDocument オブジェクトが用意されています。このオブジェクトを使用すると、元のテキスト、段組み、フォント、スタイルなどを保持したまま、文書の論理構成を維持できます。1 つの文書の画像を読み込んで前処理するには、FRDocument オブジェクトを作成し、そこに画像を追加する必要があります。方法は次のいずれかです。// 画像ファイルから FRDocument オブジェクトを作成する
FREngine.IFRDocument frDocument = engine.CreateFRDocumentFromImage( "C:\\MyImage.tif", null );
// 画像ファイルから FRDocument オブジェクトを作成する
FREngine::IFRDocumentPtr frDocument = Engine->CreateFRDocumentFromImage( L"C:\\MyImage.tif", 0 );
ドキュメントを認識するには、FRDocument オブジェクトの解析メソッドと認識メソッドを使用することをお勧めします。このオブジェクトには、ドキュメントの解析、認識、合成を行うためのさまざまなメソッドが用意されています。ドキュメントの解析、認識、合成を一括で実行できる最も便利なメソッドは、Process メソッドです。また、このメソッドは、マルチプロセッサおよびマルチコアシステムの同時処理機能を最も効率よく利用します。ただし、Preprocess、Analyze、Recognize、および Synthesize メソッドを使用して、前処理、解析、認識、合成を順番に実行することもできます。// ドキュメントを解析、認識、および合成します
// 処理プロファイルで設定されるため、追加のパラメーターは不要です
frDocument.Process( null );
// ドキュメントを解析、認識、および合成します
// 処理プロファイルで設定されるため、追加のパラメーターは不要です
frDocument->Process( 0 );
認識済みのドキュメントを保存するには、FRDocument オブジェクトの Export メソッドを使用し、パラメーターの 1 つとして FileExportFormatEnum 定数を指定します。エクスポートの既定のパラメーターは、対応するエクスポート オブジェクトを使用して変更できます。詳しくは、以下の 特定のタスク向けの追加最適化 を参照してください。FRDocument オブジェクトの使用が終わったら、このオブジェクトで使用していたすべてのリソースを解放してください。IFRDocument::Close メソッドを使用します。// 認識済みのドキュメントを構造化形式で保存します
frDocument.Export( "C:\\Data.json", FREngine.FileExportFormatEnum.FEF_JSON, null );
// FRDocument オブジェクトを解放します
frDocument.Close();
// 認識済みのドキュメントを構造化形式で保存します
frDocument->Export( L"C:\\Data.json", FREngine::FEF_JSON, 0 );
// FRDocument オブジェクトを解放します
frDocument->Close();
ステップ 6. ABBYY FineReader Engine のアンロード
ABBYY FineReader Engine の使用が完了したら、Engine オブジェクトをアンロードする必要があります。これを行うには、エクスポートされた DeinitializeEngine 関数を使用します。public class EngineLoader : IDisposable
{
// FineReader Engine をアンロードする
public void Dispose()
{
if (engine == null)
{
// Engine はロードされていない
return;
}
engine = null;
// FreeLibrary の呼び出し前にすべてのオブジェクトを削除する
GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
int hresult = deinitializeEngine();
hresult = dllCanUnloadNow();
if (hresult == 0)
{
FreeLibrary(dllHandle);
}
dllHandle = IntPtr.Zero;
initializeEngine = null;
deinitializeEngine = null;
dllCanUnloadNow = null;
// クリーンアップ後に例外をスローする
Marshal.ThrowExceptionForHR(hresult);
}
// Kernel32.dll の関数
[DllImport("kernel32.dll")]
private static extern IntPtr LoadLibraryEx(string dllToLoad, IntPtr reserved, uint flags);
private const uint LOAD_WITH_ALTERED_SEARCH_PATH = 0x00000008;
[DllImport("kernel32.dll")]
private static extern IntPtr GetProcAddress(IntPtr hModule, string procedureName);
[DllImport("kernel32.dll")]
private static extern bool FreeLibrary(IntPtr hModule);
// FREngine.dll の関数
[UnmanagedFunctionPointer(CallingConvention.StdCall, CharSet = CharSet.Unicode)]
private delegate int InitializeEngine( string customerProjectId, string LicensePath, string LicensePassword, , , , ref FREngine.IEngine engine);
[UnmanagedFunctionPointer(CallingConvention.StdCall)]
private delegate int DeinitializeEngine();
[UnmanagedFunctionPointer(CallingConvention.StdCall)]
private delegate int DllCanUnloadNow();
// private 変数
private FREngine.IEngine engine = null;
// FREngine.dll へのハンドル
private IntPtr dllHandle = IntPtr.Zero;
private InitializeEngine initializeEngine = null;
private DeinitializeEngine deinitializeEngine = null;
private DllCanUnloadNow dllCanUnloadNow = null;
}
void UnloadFREngine()
{
if( libraryHandle == 0 ) {
return;
}
// Engine オブジェクトを解放する
Engine = 0;
// FineReader Engine をアンロードする
typedef HRESULT ( STDAPICALLTYPE* DeinitializeEngineFunc )();
DeinitializeEngineFunc pDeinitializeEngine =
( DeinitializeEngineFunc )GetProcAddress( libraryHandle, "DeinitializeEngine" );
if( pDeinitializeEngine == 0 || pDeinitializeEngine() != S_OK ) {
throw L"ABBYY FineReader Engine のアンロード中にエラーが発生しました";
}
// これで FREngine.dll ライブラリを安全に解放できる
FreeLibrary( libraryHandle );
libraryHandle = 0;
}
FREngineDistribution.csv ファイルを使用すると、アプリケーションの動作に必要なファイルの一覧を自動生成できます。このシナリオで処理を行うには、列 5 (RequiredByModule) で次の値を選択します。
Core
Core.Resources
Opening
Opening, Processing
Processing
Processing.OCR
Processing.OCR, Processing.ICR
Processing.OCR.NaturalLanguages
Processing.OCR.NaturalLanguages, Processing.ICR.NaturalLanguages
Export
Export, Processing
標準シナリオを変更する場合は、それに応じて必要なモジュールも変更してください。また、アプリケーションで使用するインターフェイス言語、認識言語、および追加機能も指定する必要があります (たとえば、PDF ファイルを開く必要がある場合は Opening.PDF、CJK languages のテキストを認識する必要がある場合は Processing.OCR.CJK を指定します) 。詳細については、Working with the FREngineDistribution.csv File を参照してください。
以下に、文書を編集可能な形式に変換する各段階での設定のカスタマイズに関する追加情報を含むヘルプトピックの概要を示します。
- スキャン - Windows のみ
- Scanning
文書スキャン用の ABBYY FineReader Engine のシナリオの説明。
- 認識
- エクスポート
基本的な使用シナリオの実装