この記事は、Vantage への移行を予定している FlexiCapture ユーザーを対象としています。Vantage では、FlexiLayouts を含む FlexiCapture プロジェクトの各種コンポーネントを再利用できます。さらに、既存のラベル付きドキュメントで容易に学習できる強力な最新の機械学習テクノロジーの利点も得られます。 まずは Vantage に用意されている組み込み Skill をご確認ください。多くの場合、それらは少なくともお使いの FlexiCapture プロジェクトと同等以上の性能を発揮します。Advanced Designer と Vantage が提供する学習効率により、FlexiLayout Studio で作成した FlexiLayouts を再利用する必要がなくなる可能性もあります。 Skill Catalog には 50 を超える組み込み Skill が用意されています。ほかにも、Vantage には請求書、購買注文書、レシート、商業インボイスの処理向けの Skill があり、ABBYY FlexiCapture for Invoices の代替として利用できます。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
重要な概念
主要概念の対応
| FlexiCapture の概念 | Vantage における同等概念 |
|---|---|
| FlexiCapture project | Vantage および Advanced Designer で作成された他の Skill (Optical Character Recognition (OCR)、Classification、Document、Document Splitter) を参照する Process skill |
| Batch | トランザクション (部分的に同等) |
| Batch type, project properties | Process skill で構成されたドキュメント処理ワークフロー、Skill 設定およびアクティビティ設定 |
| Classification batches | 分類スキルの Document セット |
| Training batches | Document skill における Document セット (部分的に同等) |
| Test batches | Advanced Designer の Document skill におけるテスト用 Document セット |
| Document Definition | Document skill |
| Workflow | Process skill におけるドキュメント処理ワークフロー |
| Auto-learning for field extraction | Document skill 向けの Online learning |
| NLP models | Advanced Designer の Document skill における非構造化ドキュメント向けアクティビティ |
Documents の取り込み
ワークフローのセットアップ
ワークフロー段階の対応
| FlexiCapture のワークフロー段階 | Vantage での対応機能 |
|---|---|
| スキャン | ABBYY Vantage Scanning Station (Process skill のアクティビティには統合されていません) |
| 再スキャン | 非対応 |
| 認識 | Optical Character Recognition (OCR)、Classify、Extract、Assemble アクティビティを組み合わせたワークフロー。Optical Character Recognition (OCR) アクティビティではすべてのドキュメントに対する事前認識オプションを設定し、Classify はドキュメントを Extract アクティビティにルーティングして、そこでデータが抽出されます。 |
| ドキュメント組み立てチェック | ドキュメント集合の完全性検証は非対応です。ドキュメントを組み立てるには、Process skill の Assemble アクティビティを使用できます。 |
| バッチ完全性チェック | Scanning Station は、ドキュメントが Vantage に送信される前に自動でバッチ完全性チェックを実行します。オペレーターは Scanning Station 上で手動チェックを実行することもできます。 |
| データ検証、検証、エクスポート確認 | Process skill の 手動確認 アクティビティ。 |
| エクスポート | Process skill の Output アクティビティまたは カスタム アクティビティ。 |
| Processed、Exceptions | Vantage によって自動的に割り当てられるトランザクションのステータス。Skill Monitor の Transactions セクションでトランザクションのステータスを確認できます。 |
| ユーザータイプ | Process skill の Condition アクティビティまたは カスタム アクティビティ。 |
PDF Processing Mode
| FlexiCapture 12 | Vantage | 注記 |
|---|---|---|
| Auto | Default (推奨) — 部分一致 | FlexiCapture の Auto は、テキストレイヤーの品質に基づいて動的に選択します。Vantage の Default は固定の組み合わせ方式を使用するため、完全に同等ではありません。Auto に完全対応する機能は、今後の Vantage リリースで提供される予定です。 |
| Prefer PDF text layer if available | Use Text Layer Only | 近い一致です。どちらも埋め込みテキストレイヤーを優先し、テキストレイヤーが存在しない場合は Optical Character Recognition (OCR) にフォールバックします。 |
| Use OCR only | Use OCR Only | 完全一致です。どちらも埋め込みテキストレイヤーを無視し、すべてのページで Optical Character Recognition (OCR) を実行します。 |
移行ガイダンス: 開始時の選択
- FlexiCapture で Auto を使用していた場合: Default (推奨) から開始し、抽出結果を確認してください。精度が期待より低い場合は、Use Text Layer Only (PDF に信頼できるテキストレイヤーがある場合) または Use OCR Only (ない場合) に切り替えてください。
- FlexiCapture で “Prefer PDF text layer if available” を使用していた場合: Vantage では Use Text Layer Only を使用してください。文書内のテキストレイヤーの品質が十分であることを確認するため、結果のサンプルを確認してください。
- FlexiCapture で “Use OCR only” を使用していた場合: Vantage では Use OCR Only を使用してください。これは直接対応する設定です。
FlexiCapture の Auto モード、つまり Vantage が処理方法を選択する前にテキストレイヤーの品質を動的に評価する仕組みと完全に同等の機能は、今後の Vantage リリースで提供される予定です。それまでは、文書セットが混在している場合、Default (推奨) が現時点で最も近い選択肢です。
FlexiCapture ではこの設定はバッチタイプ レベルで一度だけ構成しますが、Vantage では Skill や Activity ごとに異なる PDF Processing Mode を設定できます。これにより、同じワークフロー内で異なる文書タイプを処理する場合でも、よりきめ細かな制御が可能になります。
ユーザーの役割
役割のマッピング
| FlexiCapture の役割 | Vantage の役割 |
|---|---|
| Scanning Operator | Skill User |
| Data Verification Operator | Manual Review Operator (特定の Skill や手動確認ステージへのアクセスを制限可能) |
| Verification Operator | Manual Review Operator (特定の Skill や手動確認ステージへのアクセスを制限可能) |
| Senior Verification Operator | Processing Supervisor |
| Project Settings Editor | Skill Designer |
| Monitoring Operator | Processing Supervisor (手動確認にもアクセス可能) |
| Administrator | Tenant Administrator |
| Web Capture Operator | Skill User + Manual Review Operator |
| Operators Manager | Tenant Administrator (ユーザー権限を管理できる唯一の役割) |
分類
Document Definitions
Vantage のデータ抽出テクノロジーは、FlexiCapture と比べて大幅に変更・改善されています。Vantage で利用可能な Extraction Rules およびその他のアクティビティの動作は、FlexiCapture の同等機能とは異なるため、場合によっては結果が異なることがあります。Document Definitions を Document skill に置き換えた後は、抽出結果に問題がないことを必ず確認してください。
固定レイアウトのドキュメント定義(フォーム)
固定レイアウトのドキュメント定義(フォーム)
フォーム向けのDocument DefinitionsはVantageで直接再利用できません。組み込みのSkillが要件に合わない場合は、FlexiCaptureからラベル付きdocumentsの該当バッチをエクスポートし、Advanced Designerで新規作成したDocument skillにインポートしてください。次に、以下の2つの選択肢があります。
- Document skillの処理フローにFast Learningアクティビティを追加し、アップロードしたdocumentsで学習します。このアクティビティは学習に大量のdocumentsを必要としません。フォーム用テクノロジーで学習を開始するには、同一フォームのインスタンスとして識別できる3件のdocumentsを追加するだけで十分です。
- Document skillの処理フローにFormsアクティビティを追加し、空白フォームの画像をアップロードします。空白フォーム上のfieldにラベル付けを行い、アクティビティを学習させます。アップロードしたdocumentsで結果をテストします。
柔軟な記述に基づくDocument Definitions
柔軟な記述に基づくDocument Definitions
多くの場合、既存のDocument Definitionは、組み込みのSkillに簡単に置き換えるか、ラベル付きdocumentsを使ってVantageまたはAdvanced Designerで新しいSkillを学習させることで対応できます。ただし、既存のFlexiLayoutに相当するものをAdvanced Designerですばやく作成する方法もあります。Advanced DesignerのDocument skillにFlexiLayoutをインポートできます。FlexiLayoutプロジェクトに基づいて新しいDocument skillを作成することも、Extraction RulesアクティビティにFlexiLayoutをインポートすることもできます。OCRの言語設定はFlexiLayoutの設定から引き継がれますが、インポート後にSkillのOCR設定を確認することをお勧めします。学習結果はAdvanced Designerに引き継げませんが、学習バッチからラベル付きdocumentsをインポートし、それらを使ってAdvanced Designerでアクティビティを再学習できます。
NLPテクノロジーを使用するDocument Definitions
NLPテクノロジーを使用するDocument Definitions
学習済みのModelはAdvanced Designerにインポートできません。ただし、Advanced Designerで利用可能なNLP Modelの1つをSkillアクティビティとして選択し、sample documentsをアップロードしてアクティビティを学習させることはできます。独自のNLP Modelを学習させるには、Advanced DesignerのDocument skillでSegmentationアクティビティおよび/またはDeep Learningアクティビティを使用します。抽出scriptsは、Advanced DesignerでもVantageでも再利用できません。
ルールのvalidation
ルールのvalidation
ルールは、VantageまたはAdvanced Designerのいずれでも再作成できます。script ruleは、Vantage JavaScriptインタープリターに対応するように書き直す必要があります。
ドキュメントのアセンブリ
ドキュメントのアセンブリ
Process skillのAssembleアクティビティを使用します。ドキュメントのアセンブリscriptを追加するには、Advanced DesignerでDocument Splitter skillを作成して設定します。scriptは、JavaScriptインタープリターに対応するように書き直す必要があります。
エクスポート設定
エクスポート設定
データ フォーム
データ フォーム
ラベル付きdocumentsまたはFlexiLayoutをAdvanced Designerにインポートすると、field構造は自動的に再作成されます。その後、VantageまたはAdvanced Designerを使用してデータ フォームのlayoutを編集できます。
ABBYY FlexiCapture for Invoices
組み込み Skill に置き換える
FlexiLayout を使用したカスタマイズ
Base: <Base Skill Name> アクティビティの後に追加します。この方法は、たとえば請求書の追加の field を取得する場合に利用できます。
複数の FlexiLayout がある場合は、Extraction Rules アクティビティを複数追加できます。たとえば、ベンダーごとに専用の FlexiLayout がある場合、各 FlexiLayout を Extraction Rules アクティビティとしてインポートし、ベースの請求書 Skill によって抽出されたベンダー ID の値を対応する各アクティビティにマッピングします。
FlexiCapture で使用していた FlexiLayout には、通貨の書式設定、地域設定、税率など、多くの追加設定が含まれている場合があります。これらの設定は通常 Vantage では不要です。組み込み Skill に関連情報がすでにすべて含まれているためです。
監視とレポート
Vantage でサポートされていない機能の一覧
- SLA 制御
- バッチ優先度
- 再スキャン
- ドキュメントのアセンブリ チェック
- インポートした画像へのユーザー添付ファイル
- ホット フォルダーから取り込んだバッチ用の説明ファイル
- 二重検証
- 分散検証
- Processing インターフェイス イベント
- スキン設定 (独自のシステムに手動確認クライアントを統合する場合にのみ、Vantage ロゴを削除できます)
- カスタム認識スクリプト
- サービス field
- 既存の field へのリンク (トランザクション内のすべての documents の field 値にはスクリプトでアクセスできます)
- Optical Character Recognition (OCR) 言語用の辞書
- ルール チェーン (Advanced Script Rule を使用した場合にのみ設定可能)
- documents のエクスポート時の機密データの墨消し
- データ フォーム、ルール名、スクリプト メッセージのローカライズ
PDF Processing Mode
Vantage で、埋め込み PDF のテキストレイヤー、Optical Character Recognition (OCR)、またはその両方を使用するかどうかを制御します。
Skill Catalog
テナント全体で Skill を検索、公開、再利用できます。
Process skill を設定する
preset workflow または一から Process skill を構築します。
Document skill を設定する
文書タイプから field を抽出するように Document skill を設定します。
Skill バージョン
Vantage における Skill のバージョン管理の仕組みと、バージョンの表示、編集、削除の方法を説明します。
