プロパティ
Engine オブジェクトを返します。 | ||
認識に使用する言語を指定します。このプロパティは、メソッドを使用して簡単に設定できます。 このプロパティは定数オブジェクトを返します。認識言語を変更するには、まず適切な作成メソッドを使用して中間の TextLanguage オブジェクトを取得し、必要なパラメーターを変更してから、取得したオブジェクトをプロパティに割り当てる必要があります。 デフォルトでは、このパラメーターは英語言語で初期化されています。 | ||
言語の自動検出を管理します。 言語の自動検出がオンの場合、テキスト内の各単語に対して認識言語が検出されます。検出される言語は、TextLanguage プロパティで指定された言語リストから選択されます。自動検出は、言語が不明なドキュメントの認識時に使用することを目的としています。 指定したすべての言語がドキュメントに含まれていることが確実な場合、自動検出は不要です。このプロパティを TSPV_No に設定してオフにしてください。 認識済みドキュメントまたは認識済みページで検出された言語のリストは、またはオブジェクトの DetectedLanguages プロパティを使用して確認できます。 デフォルトでは、このプロパティの値は TSPV_Auto です。 | ||
このプロパティの値は、認識に使用されるテキスト型を示す列挙定数の OR 結合です。たとえば、TT_Normal | TT_Index に設定した場合、ABBYY FineReader Engine はテキストが一般的な活字テキストと ZIP コード形式の数字のみを含むと見なし、他のすべての変形を無視します。テキスト型の自動検出の使用も参照してください。 注意事項:
デフォルトでは、このプロパティは TT_Normal に設定されています。 | ||
テキスト型をテキストブロックごとに個別に判定することを示します。この設定は、異なるテキスト型を持つ比較的小さなテキストブロックが存在する場合に有効ですが、処理が若干遅くなる場合があります。 このプロパティのデフォルト値は FALSE です。 | ||
対象ドキュメントに適用する認識モードを指定します。 各モードは認識速度と精度のバランスが異なり、さまざまな特性を持つ画像やドキュメントで 満足のいる結果を得ることができます。 デフォルトでは、このプロパティは RM_Normal に設定されています。 | ||
低解像度の画像上のテキストを認識するかどうかを指定します。このプロパティは、 ファックス、小さな印刷物、低解像度の画像、または印刷品質の低い画像を認識する際に役立ちます。 デフォルトでは、このプロパティの値は FALSE です。 | ||
このプロパティを TRUE に設定すると、現在の RecognizerParams オブジェクトが属するブロック内のテキストが 1 行以下であると ABBYY FineReader Engine に見なさせます。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、各テキスト行に含まれる単語が 1 つ以下であると ABBYY FineReader Engine に見なさせ、テキスト行を 1 つの単語として認識します。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、イタリック体フォントで印刷された文字を認識しないよう ABBYY FineReader Engine に指示します。イタリック文字が含まれないと想定されるテキストを 認識する場合に有効で、認識速度が向上することがあります。画像にイタリック文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、下付き文字を認識しないよう ABBYY FineReader Engine に 指示します。下付き文字が含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。画像に下付き文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、上付き文字を認識しないよう ABBYY FineReader Engine に 指示します。上付き文字が含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。画像に上付き文字が存在する場合、 このプロパティが TRUE であると、それらの文字は正しく認識されません。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、行をまたぐハイフネーションの認識を禁止します。 ハイフネーションが含まれないと想定されるテキストを認識する場合に有効で、 認識速度が向上することがあります。認識対象のブロックにハイフネーションが存在する場合、 このプロパティが TRUE であると、ハイフネーションされた単語は正しく認識されません。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティを TRUE に設定すると、スモールキャピタルを認識しないよう ABBYY FineReader Engine に指示します。 デフォルトでは、このプロパティは FALSE です。 | ||
このプロパティをTRUEに設定すると、ABBYY FineReader Engineは1つのブロックのテキストが次のブロックに続かないものとして処理します。 デフォルトでは、このプロパティはFALSEです。 | ||
このプロパティは、文字の大文字・小文字認識モードを指定します。 デフォルトでは、このプロパティの値はCRM_AutoCaseで、大文字・小文字の自動認識に対応します。 | ||
このプロパティは、文字周囲のマーキングの種類 (アンダーライン、フレーム、ボックスなど) を指定します。 各文字が個別のセルに配置されるマーキングタイプの場合は、CellsCountプロパティを使用して、認識対象ブロックの文字セル数を設定してください。 デフォルトでは、このプロパティの値はFMT_SimpleTextで、マーキングなしを意味します。 | ||
ブロック内の文字セル数を指定します。 これは、各文字が個別のセルに記入されるfieldマーキングタイプ ( FieldMarkingTypeプロパティ) にのみ有効です。 このプロパティのデフォルト値は1ですが、テキストを正しく認識するために適切な値を設定してください。 | ||
Windowsのみ。 | このプロパティは、認識中にユーザーパターンを学習するかどうかを指定します。認識中にパターン学習ダイアログが表示されます。 パターン学習プロセスを正常に動作させるには、次の設定が必要です。
関連項目:Recognizing with Training。 このプロパティをTRUEに設定した場合:
パターン学習は、中国語、日本語、韓国語には対応していません。 デフォルトでは、このプロパティはFALSEです。 | |
このプロパティをTRUEに設定すると、ABBYY FineReader Engineは認識に組み込みパターンを使用します。パターンとは、文字画像と文字自体の対応関係を定義したファイルです。装飾的なフォントや非標準フォントで入力されたテキストの認識など、標準のABBYY FineReader Engineパターンを使用せずユーザーパターンのみを使用したい場合は、このプロパティをFALSEに設定してください。このような場合は、ABBYY FineReader Engineの組み込みパターンを使用せず、対象フォント用に学習させた独自のユーザー定義パターンを使用することをお勧めします。 ユーザー定義パターンファイルへのパスは UserPatternsFileプロパティに格納されます。UserPatternsFile プロパティが空の場合、UseBuiltInPatterns プロパティは無視されます。Windowsの場合は、関連項目としてRecognizing with Trainingもご参照ください。 デフォルトでは、このプロパティはTRUEです。 | ||
認識に使用するユーザーパターンファイルへのフルパスを格納します。このプロパティの値が空でない場合、認識時にユーザーパターンファイルの情報が使用されます。 UseBuiltInPatterns プロパティが FALSE の場合、つまり認識時に標準の ABBYY FineReader Engine パターンが使用されない場合、このプロパティにはユーザー定義パターンファイルへのパスを指定する必要があります。そのファイルに格納されている情報のみが使用されるためです。Windows の場合は、Recognizing with Trainingも参照してください。 デフォルトでは、このプロパティは空の文字列を格納します。
| ||
認識の確度が低い文字に対して、 IsSuspicious プロパティを TRUE に設定するかどうかを指定します。 このプロパティ名は、ABBYY FineReader がテキスト内の疑わしい文字を背景色でハイライト表示することでオペレーターによる手動検証を容易にするという動作を反映しています。 デフォルトでは、このプロパティは TRUE です。 | ||
このプロパティは非推奨であり、将来のバージョンで削除される予定です。 | ||
正確な文字領域 () を保存するかどうかを指定します。 デフォルト値は FALSE です。 | ||
文字の認識バリアントを保存するかどうかを指定します。 デフォルト値は FALSE です。 | ||
単語の認識バリアントを保存するかどうかを指定します。 IParagraph::GetWordRecognitionVariantsメソッドおよびICharParams::WordRecognitionVariantsプロパティは、単語の認識バリアントのコレクションを返します。Voting API の使用も参照してください。 デフォルト値は FALSE です。 | ||
メソッド
| 名前 | 説明 |
|---|---|
| CopyFrom | 現在のオブジェクトのプロパティを、別のオブジェクトの対応するプロパティの値で初期化します。 |
| LoadFromFile | ディスク上のファイルからオブジェクトの内容を復元します。 |
| LoadFromMemory <Note> Windowsのみ。 </Note> | グローバルメモリからオブジェクトの内容を復元します。 |
| SaveToFile | オブジェクトの内容をディスク上のファイルに保存します。 |
| SaveToMemory <Note> Windowsのみ。 </Note> | オブジェクトの内容をグローバルメモリに保存します。 |
| SetPredefinedTextLanguage | 認識言語を、あらかじめ定義された ABBYY FineReader Engine の言語のいずれかに設定します。 |
オブジェクト図
出力パラメーター
入力パラメーター
- Preprocess、PreprocessPages、Analyze、AnalyzePages:FRDocument オブジェクトのメソッド
- Preprocess、Analyze、AnalyzeRegion、AnalyzeTable、IsEmpty:FRPage オブジェクトのメソッド
サンプル
C# コード
C# コード
- Linux: CustomLanguage, CommandLineInterface
- Windows: CustomLanguage, CommandLineInterface、およびデモツール: BatchProcessingRecognition, Classification, MultiProcessingRecognition, PDFExportProfiles, User Pattern Training Utility
