macOS では Office ドキュメントはサポートされていません。
要素
| 名前 | 説明 |
|---|---|
| CRM_Auto | ABBYY FineReader Engine は、PDF ファイルまたは Office ドキュメントの処理に適したモードを自動的に選択します。このモードで期待どおりの結果が得られない場合や、文書の種類と使用すべき再利用モードが事前にわかっている場合は、モードを手動で選択できます。 |
| CRM_ContentAndPictures | ABBYY FineReader Engine は、元の PDF ファイルまたは Office ドキュメントの各ページの各部分について、テキストと画像の使用方法を自動的に選択します。つまり、元のファイルの内容とラスタライズされた画像の両方を処理に使用します。元のファイルのテキストが良好と判断された場合はそのテキストが使用され、そうでない場合はその部分のラスターから取得したテキストが使用されます。 |
| CRM_ContentOnly | ABBYY FineReader Engine は、元の PDF ファイルまたは Office ドキュメントのテキストと画像の両方を使用します。 <Warning> 元のファイルのテキスト内容を使用すると処理は高速になりますが、このモードを選択した場合、テキストレイヤーがないとエラーが発生します。 </Warning> このモードは、Unicode、ASCII、またはその他の文字エンコーディング規格でエンコードされた可視テキストを含み、フォントとサイズが正しく設定されている元のファイルに使用することをお勧めします。元のファイルがそれ以外の種類の場合は、CRM_Auto、CRM_ContentAndPictures、または CRM_DoNotReuse を使用してください。 <Warning> このモードは、文書をメモリ内で並列処理する場合 (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) には使用できません。 </Warning> |
| CRM_DoNotReuse | ABBYY FineReader Engine は、元の PDF ファイルまたは Office ドキュメントのページをラスタライズして処理します。元のファイルの内容は使用されません。 |
ファイルにテキストレイヤーが含まれているかどうかを確認するには、IsPdfWithTextualContent メソッドを使用してください。
備考
- CRM_DoNotReuse — 単語モデルの型は常に判定されます。
- CRM_Auto, CRM_ContentAndPictures — 単語モデルの型を判定するかどうかは、文書内容認識を使用するかどうかに依存します。
- CRM_ContentOnly — 単語モデルの型は判定されません。
