メインコンテンツへスキップ
このオブジェクトでは、認識パラメーターを調整できます。レイアウト内の各テキストブロックおよび各表セルには、それぞれ RecognizerParams 型の子オブジェクトがあります。また、このオブジェクトは、PageProcessingParams オブジェクトのサブオブジェクトとして、ABBYY FineReader Engine のレイアウト解析・認識関数に渡されます。認識関数では、テキストブロックおよび表セルの RecognizerParams 型の子オブジェクトで定義された認識パラメーターが使用されます。 レイアウト解析中にテキストブロックまたは表セルが作成されるたびに、その RecognizerParams 型の子オブジェクトのプロパティは、解析関数に渡された RecognizedParams オブジェクトのプロパティ値で初期化されます。LayoutBlocks オブジェクトの AddNew メソッドで作成されるブロックのサブオブジェクトのプロパティには、適切な既定値が設定されます。各プロパティの既定値については、それぞれの説明を参照してください。 RecognizerParams オブジェクトは永続オブジェクトです。つまり、オブジェクトの現在の状態を永続ストレージに書き込むことができます。後で、永続ストレージからオブジェクトの状態を読み込むことで、オブジェクトを再作成できます。オブジェクトの永続化には、次のメソッドを使用します。 Linux: SaveToFile および LoadFromFile Windows: SaveToFileLoadFromFileSaveToMemory、および LoadFromMemory

プロパティ

,read-only

Engine オブジェクトを返します。

認識に使用する言語を指定します。このプロパティは、メソッドを使用して簡単に設定できます。

このプロパティは定数オブジェクトを返します。認識言語を変更するには、まず適切な作成メソッドを使用して中間の TextLanguage オブジェクトを取得し、必要なパラメーターを変更してから、取得したオブジェクトをプロパティに割り当てる必要があります。

デフォルトでは、このパラメーターは英語言語で初期化されています。

言語の自動検出を管理します。

言語の自動検出がオンの場合、テキスト内の各単語に対して認識言語が検出されます。検出される言語は、TextLanguage プロパティで指定された言語リストから選択されます。自動検出は、言語が不明なドキュメントの認識時に使用することを目的としています。

言語の自動検出は、事前定義言語のみを対象としています (完全なリストはABBYY FineReader Engine の事前定義言語)を参照してください。

指定したすべての言語がドキュメントに含まれていることが確実な場合、自動検出は不要です。このプロパティを TSPV_No に設定してオフにしてください。

認識済みドキュメントまたは認識済みページで検出された言語のリストは、またはオブジェクトの DetectedLanguages プロパティを使用して確認できます。

デフォルトでは、このプロパティの値は TSPV_Auto です。

このプロパティの値は、認識に使用されるテキスト型を示す列挙定数の OR 結合です。たとえば、TT_Normal | TT_Index に設定した場合、ABBYY FineReader Engine はテキストが一般的な活字テキストと ZIP コード形式の数字のみを含むと見なし、他のすべての変形を無視します。テキスト型の自動検出の使用も参照してください。

注意事項:

  • このプロパティが TT_Matrix、TT_Typewriter、TT_OCR_A、TT_OCR_B のいずれかの組み合わせに設定されている場合、ProhibitItalic ProhibitSubscript ProhibitSuperscript プロパティの値にかかわらず、イタリック体フォントおよび上付き文字/下付き文字は認識されません。
  • このプロパティが TT_Handwritten の場合、画像の向きを補正することはできません。
  • Windows の場合:
    • このプロパティが TT_Handwritten または TT_Index に設定されている場合、TrainUserPatterns プロパティを TRUE に設定することはできません。
    • TrainUserPatterns プロパティが TRUE に設定されている場合、TextTypes プロパティには 1 つのテキスト型のみを含める必要があります。

デフォルトでは、このプロパティは TT_Normal に設定されています。

テキスト型をテキストブロックごとに個別に判定することを示します。この設定は、異なるテキスト型を持つ比較的小さなテキストブロックが存在する場合に有効ですが、処理が若干遅くなる場合があります。

このプロパティのデフォルト値は FALSE です。

対象ドキュメントに適用する認識モードを指定します。 各モードは認識速度と精度のバランスが異なり、さまざまな特性を持つ画像やドキュメントで 満足のいる結果を得ることができます。

デフォルトでは、このプロパティは RM_Normal に設定されています。

精度優先モードでは、組み込みパターンが常に使用されます。組み込みパターンを無効にするには、 通常モード (RM_Normal) に切り替えてください。

低解像度の画像上のテキストを認識するかどうかを指定します。このプロパティは、 ファックス、小さな印刷物、低解像度の画像、または印刷品質の低い画像を認識する際に役立ちます。

デフォルトでは、このプロパティの値は FALSE です。

このプロパティを TRUE に設定すると、現在の RecognizerParams オブジェクトが属するブロック内のテキストが 1 行以下であると ABBYY FineReader Engine に見なさせます。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、各テキスト行に含まれる単語が 1 つ以下であると ABBYY FineReader Engine に見なさせ、テキスト行を 1 つの単語として認識します。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、イタリック体フォントで印刷された文字を認識しないよう ABBYY FineReader Engine に指示します。イタリック文字が含まれないと想定されるテキストを 認識する場合に有効で、認識速度が向上することがあります。画像にイタリック文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、下付き文字を認識しないよう ABBYY FineReader Engine に 指示します。下付き文字が含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。画像に下付き文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、上付き文字を認識しないよう ABBYY FineReader Engine に 指示します。上付き文字が含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。画像に上付き文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、行をまたぐハイフネーションの認識を禁止します。 ハイフネーションが含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。認識対象のブロックにハイフネーションが存在する場合、 このプロパティが TRUE であると、ハイフネーションされた単語は正しく認識されません。

デフォルトでは、このプロパティは FALSE です。

このプロパティを TRUE に設定すると、スモールキャピタルを認識しないよう ABBYY FineReader Engine に指示します。

デフォルトでは、このプロパティは FALSE です。

このプロパティをTRUEに設定すると、ABBYY FineReader Engineは1つのブロックのテキストが次のブロックに続かないものとして処理します。

デフォルトでは、このプロパティはFALSEです。

このプロパティは、文字の大文字・小文字認識モードを指定します。

デフォルトでは、このプロパティの値はCRM_AutoCaseで、大文字・小文字の自動認識に対応します。

このプロパティは、文字周囲のマーキングの種類 (アンダーライン、フレーム、ボックスなど) を指定します。

各文字が個別のセルに配置されるマーキングタイプの場合は、CellsCountプロパティを使用して、認識対象ブロックの文字セル数を設定してください。

デフォルトでは、このプロパティの値はFMT_SimpleTextで、マーキングなしを意味します。

ブロック内の文字セル数を指定します。

これは、各文字が個別のセルに記入されるfieldマーキングタイプ ( FieldMarkingTypeプロパティ) にのみ有効です。

このプロパティのデフォルト値は1ですが、テキストを正しく認識するために適切な値を設定してください。

Windowsのみ。

このプロパティは、認識中にユーザーパターンを学習するかどうかを指定します。認識中にパターン学習ダイアログが表示されます。

パターン学習プロセスを正常に動作させるには、次の設定が必要です。

  • 親ウィンドウのHWNDハンドル (プロパティ) の値を設定する
  • UserPatternsFileプロパティにユーザーパターンファイルを指定する

関連項目:Recognizing with Training

このプロパティをTRUEに設定した場合:

  • TextTypesプロパティに含めるテキストタイプは1つのみとし、TT_HandwrittenまたはTT_Indexは指定できません
  • PagePreprocessingParamsオブジェクトのプロパティをTRUEに設定することはできません
パターン学習は、中国語、日本語、韓国語には対応していません。

デフォルトでは、このプロパティはFALSEです。

このプロパティをTRUEに設定すると、ABBYY FineReader Engineは認識に組み込みパターンを使用します。パターンとは、文字画像と文字自体の対応関係を定義したファイルです。装飾的なフォントや非標準フォントで入力されたテキストの認識など、標準のABBYY FineReader Engineパターンを使用せずユーザーパターンのみを使用したい場合は、このプロパティをFALSEに設定してください。このような場合は、ABBYY FineReader Engineの組み込みパターンを使用せず、対象フォント用に学習させた独自のユーザー定義パターンを使用することをお勧めします。

ユーザー定義パターンファイルへのパスは UserPatternsFileプロパティに格納されます。UserPatternsFile プロパティが空の場合、UseBuiltInPatterns プロパティは無視されます。Windowsの場合は、関連項目としてRecognizing with Trainingもご参照ください。

デフォルトでは、このプロパティはTRUEです。

このプロパティをFALSEに設定できるのは、通常認識モードおよび高速認識モードを使用する場合のみです。精度優先モードでは組み込みパターンの使用を無効にすることはできません (Modeプロパティの説明を参照してください) 。

認識に使用するユーザーパターンファイルへのフルパスを格納します。このプロパティの値が空でない場合、認識時にユーザーパターンファイルの情報が使用されます。

UseBuiltInPatterns プロパティが FALSE の場合、つまり認識時に標準の ABBYY FineReader Engine パターンが使用されない場合、このプロパティにはユーザー定義パターンファイルへのパスを指定する必要があります。そのファイルに格納されている情報のみが使用されるためです。Windows の場合は、Recognizing with Trainingも参照してください。

デフォルトでは、このプロパティは空の文字列を格納します。

ABBYY FineReader Engine 10 以前で作成されたユーザーパターンファイルは、FineReader Engine 12 Release 6 以降では開くことができません。引き続き使用するには、古いユーザーパターンファイルを新しい形式で保存してください。
  • FineReader Engine 11 または FineReader Engine 12 Release 5 以前を使用してください。
  • オブジェクトのメソッドを呼び出し、古いパターンファイルの名前と新しいファイルへのフルパスを含む文字列コレクションを渡してください。

認識の確度が低い文字に対して、 IsSuspicious プロパティを TRUE に設定するかどうかを指定します。

このプロパティ名は、ABBYY FineReader がテキスト内の疑わしい文字を背景色でハイライト表示することでオペレーターによる手動検証を容易にするという動作を反映しています。

デフォルトでは、このプロパティは TRUE です。

このプロパティは非推奨であり、将来のバージョンで削除される予定です。

正確な文字領域 () を保存するかどうかを指定します。

デフォルト値は FALSE です。

文字の認識バリアントを保存するかどうかを指定します。

ICharParams::CharacterRecognitionVariantsプロパティは、文字の認識バリアントのコレクションを返します。Voting API の使用も参照してください。

デフォルト値は FALSE です。

単語の認識バリアントを保存するかどうかを指定します。

IParagraph::GetWordRecognitionVariantsメソッドおよびICharParams::WordRecognitionVariantsプロパティは、単語の認識バリアントのコレクションを返します。Voting API の使用も参照してください。

デフォルト値は FALSE です。

メソッド

名前説明
CopyFrom現在のオブジェクトのプロパティを、別のオブジェクトの対応するプロパティの値で初期化します。
LoadFromFileディスク上のファイルからオブジェクトの内容を復元します。
LoadFromMemory <Note> Windowsのみ。 </Note>グローバルメモリからオブジェクトの内容を復元します。
SaveToFileオブジェクトの内容をディスク上のファイルに保存します。
SaveToMemory <Note> Windowsのみ。 </Note>オブジェクトの内容をグローバルメモリに保存します。
SetPredefinedTextLanguage認識言語を、あらかじめ定義された ABBYY FineReader Engine の言語のいずれかに設定します。
RecognizerParams オブジェクト図

出力パラメーター

このオブジェクトは、Engine オブジェクトの CreateRecognizerParams メソッドの出力パラメーターです。

入力パラメーター

このオブジェクトは、次のメソッドの入力パラメーターとして渡されます。

サンプル

FREngine.IEngine engine;
string fileName;
// 認識時にユーザーパターンをトレーニングする
FREngine.IDocumentProcessingParams processingParams = Engine.CreateDocumentProcessingParams();
FREngine.IRecognizerParams recognizerParams = processingParams.PageProcessingParams.RecognizerParams;
Engine.CreateEmptyUserPattern( fileName );
Engine.MultiProcessingParams.MultiProcessingMode = FREngine.MultiProcessingModeEnum.MPM_Sequential;
recognizerParams.UserPatternsFile = fileName;
recognizerParams.TrainUserPatterns = true;
Document.Process(processingParams);
このオブジェクトは、次のコードサンプルで使用されています。

関連項目

前処理、解析、認識、合成のパラメーター調整 手書き文字の認識 PageProcessingParams TextBlock プロパティ の操作