メインコンテンツへスキップ
このトピックは Windows 版 FRE に適用されますが、Visual Components は必要ありません。
IRecognizerParams::TrainUserPatterns プロパティが TRUE に設定されている場合、認識処理中に Train User Pattern モードが使用されます。未知の文字が見つかるたびに、文字画像が表示された パターン学習 ダイアログが開きます。 PatternTrainingDialog
IEngine::TrainUserPattern メソッドを使用して、ダイアログを表示せずにパターン学習を実行することもできます。このメソッドは、文字画像の collection を格納する TrainingImagesCollection オブジェクトと、その文字自体を入力パラメーターとして受け取ります。

文字認識の学習

上部のダイアログウィンドウ内のフレームは、1文字だけを囲み、その文字全体が完全にフレーム内に収まるようにしてください。フレームが文字の一部しか囲んでいない場合や、複数の文字を囲んでいる場合は、フレームの境界線をクリックして移動し、上記の条件を満たすように調整します。MoveBodyLeft ボタンと MoveBodyRight ボタンでもフレームの境界線を移動できます (斜体文字の学習時に便利です) 。フレームを正しく配置したら、文字を入力して「Train」ボタンをクリックします。
  • 学習できるのは、アルファベットに含まれる文字だけです。キーボードから入力できない文字を ABBYY FineReader Engine に認識させる場合は、その文字を表す2文字の組み合わせを使用するか、文字テーブルから必要な文字をコピーしてください (文字テーブルを開くには、「パターン学習」ダイアログで DotButton ボタンをクリックします) 。
  • 文字の書式も保持するように学習させる場合は、「Train」ボタンをクリックする前に、「パターン学習」ダイアログで該当する「Italic」または「Bold」項目を選択してください。
  • 大文字の文字画像を学習させる場合は大文字のみを、小文字の文字画像を学習させる場合は小文字のみを入力してください。
学習中に間違えた場合は、「Back」ボタンをクリックすると、フレームを前の位置に戻せます。最後に入力した「画像 — 文字」の組み合わせは、パターンから自動的に削除されます。なお、この「元に戻す」機能が有効なのは、最後に学習させた単語のみです。

合字を認識するためのトレーニング

合字とは、たとえば fi、fl、ffi のように、2 文字または 3 文字が「くっついた」組み合わせのことです。これらの文字は、印刷工程の一部として「くっついて」いるため、切り分けるのが困難です。実際には、これらを「1 つの」複合文字として扱うほうが、より良い結果が得られます。 合字のトレーニングは、個々の文字のトレーニングと変わりありません。
  1. 必要な文字の組み合わせを入力し、Train ボタンをクリックします。
  2. 上部のダイアログウィンドウ内の枠で、合字全体を囲むようにします。マウスを使うか、MoveBodyLeft および MoveBodyRight ボタンをクリックして、枠線を移動できます。
各パターンには最大 1000 個の新しい文字を含めることができます。ただし、合字を作成しすぎると認識品質に悪影響を及ぼす可能性があるため、作成しすぎないようにしてください。

学習時の制限事項

ABBYY FineReader Engine を学習させる際は、次の制限事項も考慮してください。
  • ABBYY FineReader Engine では、通常は別の文字と見なされる一部の文字が区別されません。このような画像は、同じ文字として認識されます。たとえば、ストレート (’)、右 (’)、左 (‘) の各アポストロフィは、パターン内では 1 つの文字、つまりストレートアポストロフィとして保持されます。そのため、これらを学習させようとしても、認識結果のテキストに右アポストロフィや左アポストロフィが現れることはありません。
  • 場合によっては、ある画像が周囲の文字環境に応じて特定の文字として認識されます。
  • CJK 言語では、パターン学習はサポートされていません。

関連項目

トレーニングによる認識 RecognizerParams