SourceContentReuseModeEnum - ABBYY Documentation

SourceContentReuseModeEnum の列挙定数は、ソース PDF ファイルおよび Office ドキュメントの内容を再利用する際に使用できるモードを示します。

macOS では Office ドキュメントはサポートされていません。

typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

要素

名前	説明
CRM_Auto	ABBYY FineReader Engine は、PDF ファイルまたは Office ドキュメントの処理に適したモードを自動的に選択します。このモードで期待どおりの結果が得られない場合や、文書の種類と使用すべき再利用モードが事前にわかっている場合は、モードを手動で選択できます。
CRM_ContentAndPictures	ABBYY FineReader Engine は、ソース PDF ファイルまたは Office ドキュメントの各ページの各部分について、テキストと画像の使用方法を自動的に選択します。つまり、元のファイルの内容とラスタライズされた画像の両方を処理に使用します。元のファイルのテキストが良好と判断された場合はそのテキストが使用され、そうでない場合はその部分のラスターから取得したテキストが使用されます。
CRM_ContentOnly	ABBYY FineReader Engine は、ソース PDF ファイルまたは Office ドキュメントのテキストと画像の両方を使用します。元のファイルのテキスト内容を使用すると処理は高速になりますが、このモードを選択した場合、テキストレイヤーがないとエラーが発生します。このモードは、Unicode、ASCII、またはその他の文字エンコーディング規格でエンコードされた可視テキストを含み、フォントとサイズが正しく設定されている元のファイルに使用することをお勧めします。元のファイルがそれ以外の種類の場合は、CRM_Auto、CRM_ContentAndPictures、または CRM_DoNotReuse を使用してください。このモードは、文書をメモリ内で並列処理する場合 (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) には使用できません。
CRM_DoNotReuse	ABBYY FineReader Engine は、ソース PDF ファイルまたは Office ドキュメントのページをラスタライズして処理します。元のファイルの内容は使用されません。

ファイルにテキストレイヤーが含まれているかどうかを確認するには、IsPdfWithTextualContent メソッドを使用してください。

備考

文書の内容認識は、単語モデルの型を判定する処理とあわせて実行されます (IWord::ModelTypeを参照) 。この処理は、選択した内容再利用モードによって異なります。

CRM_DoNotReuse — 単語モデルの型は常に判定されます。
CRM_Auto, CRM_ContentAndPictures — 単語モデルの型を判定するかどうかは、文書内容認識を使用するかどうかに依存します。
CRM_ContentOnly — 単語モデルの型は判定されません。

使用箇所

IObjectsExtractionParams::SourceContentReuseMode

SkewCorrectionModeEnum

SpeedQualityModeEnum

⌘I

​要素

​備考

​使用箇所

要素

備考

使用箇所