OCR Skillを作成するには、次の手順に従います。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
一般設定を構成する
General タブで次の操作を行います。
- 新しいSkillの名前と説明を入力します。
- Technology Core のバージョンを選択します。最新バージョンを選択することをお勧めします。
- Default (推奨) — 使用可能な場合は埋め込みの テキストレイヤー を使用し、必要に応じて OCR で補完します。これは既定の設定です。
- Use Text Layer Only — 埋め込みの テキストレイヤー からテキストを抽出します。テキストレイヤー が存在しない場合、Vantage は自動的に OCR にフォールバックします。
- Use OCR Only — 埋め込みの テキストレイヤー を無視し、文書全体に対して OCR を実行します。
各モードの詳細と選択時のガイダンスについては、PDF Processing Mode を参照してください。
認識言語を選択する
Languages タブで次の操作を行います。
- Allowed Languages セクションで、文書認識言語を 1 つ以上選択します。処理時には、設定時に指定した言語の中から文書の言語が自動的に選択されます。なお、選択する言語数は認識速度や品質に影響する場合があります。
- 文書に手書き文字が含まれている場合は、Text Appearance セクションで Handwritten オプションを有効にします。
画像補正を構成する
Image Enhancements タブでは、Crop Image と Correct Page Orientation が既定で有効になっています。文書でこれらの機能が不要な場合は、必要に応じて無効にしてください。
- Crop Image は、画像を元の文書の端に合わせて切り抜きます。
- Correct Page Orientation は、画像を自動的に回転して元の向きに戻します。
バーコード認識を有効にする
Barcodes タブで、文書に含まれる可能性のあるバーコードの種類を有効にします。選択するバーコードの種類数は認識速度に影響する場合があります。 バーコードを認識する必要がない場合は、Barcode Types テーブルのヘッダーで、選択されているオプション数が表示されたボタンをクリックし、Deselect all をクリックします。
利用可能なエクスポート形式
- JSON (既定の形式) :
- テキストのみ (既定のオプション) 。エクスポートされる JSON ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる JSON ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトも保持されます。
- XML:
- テキストのみ。エクスポートされる XML ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる XML ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトが保持されます。
- ALTOXML:
- テキストのみ。エクスポートされる ALTO XML ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる ALTO XML ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトが保持されます。
- PDF:
- PDF/A-3a (既定の PDF エクスポート形式)
- PDF/A-3b
- 画像のみ。編集不可の PDF (PDF/A-3b 準拠)
- TXT
- DOCX (Microsoft Word) :
- 編集可能。エクスポートされる DOCX ファイルは元の書式とテキストフローを維持しつつ、容易に編集できます。出力ドキュメントは元の画像と異なる場合があります。
- 厳密。エクスポートされる DOCX ファイルは元のドキュメントの書式を忠実に維持します。これにより、出力ドキュメントのテキストや書式に加えられる変更が制限される場合があります。
- XLSX (Microsoft Excel)
- TIFF
- JPEG:
- 最高品質。エクスポートされるファイルには、圧縮率 95% の JPEG が含まれます。
- サイズ縮小。エクスポートされるファイルには、圧縮率 75% の JPEG が含まれます。
- PPTX (Microsoft PowerPoint)
- HTML
OCR Skill
OCR Skill の概要と、抽出できる内容を説明します。
PDF Processing Mode
Vantage で埋め込み PDF のテキストレイヤー、OCR、またはその組み合わせを使用するかどうかを制御します。
OCR アクティビティ
Process Skill ワークフローの一部として OCR Skill を実行します。
データのエクスポート形式
すべてのエクスポート形式とオプションのリファレンスです。
Technology Core のバージョン
Skill を実行するエンジンのバージョンを選択します。
