OCR Skillの設定 - ABBYY Documentation

OCR Skillを作成するには、次の手順に従います。

新しいOCR Skillを作成する

Skill Catalog の ツールバー で Create ボタンをクリックします。

OCR Skillの種類を選択する

OCR Skill の Skill type を選択します。Create OCR Skill ダイアログが開きます。

一般設定を構成する

General タブで次の操作を行います。

新しいSkillの名前と説明を入力します。
Technology Core のバージョンを選択します。最新バージョンを選択することをお勧めします。

画像処理Image Processing で PDF Processing Mode のドロップダウンを開き、PDF文書の処理モードを選択します。

Default (推奨) — 使用可能な場合は埋め込みのテキストレイヤーを使用し、必要に応じて OCR で補完します。これは既定の設定です。
Use Text Layer Only — 埋め込みのテキストレイヤーからテキストを抽出します。テキストレイヤーが存在しない場合、Vantage は自動的に OCR にフォールバックします。
Use OCR Only — 埋め込みのテキストレイヤーを無視し、文書全体に対して OCR を実行します。

各モードの詳細と選択時のガイダンスについては、PDF Processing Mode を参照してください。

認識言語を選択する

Languages タブで次の操作を行います。

Allowed Languages セクションで、文書認識言語を 1 つ以上選択します。処理時には、設定時に指定した言語の中から文書の言語が自動的に選択されます。なお、選択する言語数は認識速度や品質に影響する場合があります。
文書に手書き文字が含まれている場合は、Text Appearance セクションで Handwritten オプションを有効にします。

画像補正を構成する

Image Enhancements タブでは、Crop Image と Correct Page Orientation が既定で有効になっています。文書でこれらの機能が不要な場合は、必要に応じて無効にしてください。

Crop Image は、画像を元の文書の端に合わせて切り抜きます。
Correct Page Orientation は、画像を自動的に回転して元の向きに戻します。

バーコード認識を有効にする

Barcodes タブで、文書に含まれる可能性のあるバーコードの種類を有効にします。選択するバーコードの種類数は認識速度に影響する場合があります。バーコードを認識する必要がない場合は、Barcode Types テーブルのヘッダーで、選択されているオプション数が表示されたボタンをクリックし、Deselect all をクリックします。

単一のトランザクションの一部として OCR Skill を使用して複数の文書ファイルを処理する場合、すべてのファイルは 1 つに結合されます。その結果、出力ファイル数は指定したエクスポート形式の数と同じになります。

エクスポート形式を選択する

Export タブで、文書のエクスポート形式を 1 つ以上選択します。

利用可能なエクスポート形式

JSON (既定の形式) :
- テキストのみ (既定のオプション) 。エクスポートされる JSON ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる JSON ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトも保持されます。
XML:
- テキストのみ。エクスポートされる XML ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる XML ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトが保持されます。
ALTOXML:
- テキストのみ。エクスポートされる ALTO XML ファイルには認識結果のテキストのみが含まれ、ドキュメントのレイアウトは保持されません。テキストのみを選択した場合、DOCX、XLSX、PPTX へのエクスポートはできません。
- ドキュメント構造を保持。エクスポートされる ALTO XML ファイルには認識結果のテキストが含まれ、ドキュメントのレイアウトが保持されます。

JSON、XML、ALTOXML のエクスポートオプション (テキストのみ と ドキュメント構造を保持) は同じである必要があります。これらの形式のいずれかに別のエクスポートオプションを指定した場合、そのオプションが他の形式にも適用されます。

PDF:
- PDF/A-3a (既定の PDF エクスポート形式)
- PDF/A-3b
- 画像のみ。編集不可の PDF (PDF/A-3b 準拠)

各 PDF のエクスポートオプションで、「ファイルサイズを小さく」 (既定) または「最高品質」から選択します。ファイルサイズの縮小は Mixed Raster Content (MRC) 圧縮によって実現され、テキスト・画像・背景それぞれに最適な圧縮率が個別に適用されます。

TXT
DOCX (Microsoft Word) :
- 編集可能。エクスポートされる DOCX ファイルは元の書式とテキストフローを維持しつつ、容易に編集できます。出力ドキュメントは元の画像と異なる場合があります。
- 厳密。エクスポートされる DOCX ファイルは元のドキュメントの書式を忠実に維持します。これにより、出力ドキュメントのテキストや書式に加えられる変更が制限される場合があります。
XLSX (Microsoft Excel)
TIFF
JPEG:
- 最高品質。エクスポートされるファイルには、圧縮率 95% の JPEG が含まれます。
- サイズ縮小。エクスポートされるファイルには、圧縮率 75% の JPEG が含まれます。
PPTX (Microsoft PowerPoint)
HTML

​利用可能なエクスポート形式

​関連トピック

利用可能なエクスポート形式

関連トピック