OCR アクティビティは、一般的な前認識オプションを指定し、全文認識を実行するために使用します。ほかのアクティビティや Skill は、OCR アクティビティで得られた認識結果を利用して処理を高速化できます。 ドキュメントを認識する際、次のすべての条件を満たしている場合、後続のアクティビティや Skill は OCR アクティビティの認識結果を使用します。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- 後続のアクティビティまたは Skill に設定された言語の集合が、OCR アクティビティに設定された言語の集合と同一、または OCR アクティビティの言語を包含している。
- 後続のアクティビティまたは Skill のテキストタイプ設定 (例:Printed または 手書き文字 の認識オプション) が、OCR アクティビティのテキストタイプ設定と同一である。
- 後続のアクティビティまたは Skill に設定されたバーコード種別の集合が、OCR アクティビティに設定されたバーコード種別の集合と同一、または OCR アクティビティのバーコード種別を包含している。後続のアクティビティでバーコード種別が有効化されていない場合、OCR アクティビティのバーコード種別設定は無視されます。
OCR アクティビティを設定する
PDF Processing Modeを設定する
General タブの Image Processing で、このアクティビティで Vantage が PDF ドキュメントをどのように処理するかを指定する PDF Processing Mode を選択します。
- Default (推奨) — 埋め込みの PDF テキストレイヤーが利用可能な場合はそれを使用し、必要に応じて OCR で補完します。
- Use Text Layer Only — 埋め込みの PDF テキストレイヤーからテキストを抽出します。テキストレイヤーが存在しない場合は OCR にフォールバックします。
- Use OCR Only — 埋め込みのテキストレイヤーを無視して、全面的に OCR を実行します。
認識言語を選択する
Languages タブで、次の操作を行います。
- Allowed Languages セクションで、1 つ以上のドキュメント認識言語を選択します。処理時には、設定時に指定した言語の中からドキュメント言語が自動的に選択されます。選択する言語数は認識速度と品質に影響する場合があることに注意してください。
- ドキュメントに手書き文字が含まれている場合は、Text Appearance セクションで 手書き文字 オプションを有効にします。手書き文字認識でサポートされている言語を参照してください。
バーコード認識を有効にする
Barcodes タブで、ドキュメントに含まれる可能性のあるバーコード種別を有効にします。選択したバーコード種別の数は、認識速度に影響する場合があります。バーコードを認識する必要がない場合は、Barcode Types テーブルのヘッダーにある、選択済みオプション数が表示されたボタンをクリックし、Deselect all をクリックします。
OCR skill
文書画像からテキストを抽出し、結果をさまざまな形式でエクスポートします。
Process skill を設定する
プリセットワークフローまたは一から Process skill を構築し、各アクティビティを設定します。
サポートされている認識言語
Vantage の各 Skill でサポートされている OCR 言語の一覧です。
サポートされているバーコード種別
Vantage が認識できるすべてのバーコードおよび QR コード形式の一覧です。
Extract アクティビティ
Document skill を使用して文書から field の値を抽出します。
Classify アクティビティ
文書タイプを識別し、各文書を適切な後続プロセスに振り分けます。
