メインコンテンツへスキップ

概要

ABBYY Vantage でドキュメント処理ワークフローを構築する前に、使用する Skill の種類を決める必要があります。最初に適切な選択をしておけば、大幅な時間の節約になり、手戻りも防げます。 このページで学べること:
  • Base Skill、Derived Skill、New Skill とは何か
  • 各アプローチの主な違い
  • Base Skill から Derived Skill を作成する方法
  • ゼロから New Skill を作成する方法
  • 状況に応じてどのアプローチを選ぶべきか
所要時間: 約5分

3種類のSkillを理解する

Base SkillDerived SkillNew Skill
SourceABBYY が提供Base Skill からコピーゼロから構築
Editableいいえはいはい
Pre-trainedはいはい (継承)いいえ — 自分でトレーニングします
Updates with ABBYY releasesはい (自動)任意 (手動同期)いいえ
Best forそのまま使う、または出発点として使う既存の Skill をカスタマイズする完全にカスタムの文書タイプ

Base Skills

Base Skills とは

Base Skills は、ABBYY が提供する事前学習済みの読み取り専用の Skill です。請求書、購買注文書、本人確認書類など、一般的な文書タイプをすぐに処理できるように設計されています。Base Skill を直接編集することはできませんが、そのまま使用することも、Derived Skill の作成の出発点として使用することもできます。

確認場所

Base Skills は Skill Catalog に一覧表示されます。開くには、次の手順を実行します。
  1. ABBYY Vantage テナントにサインインします。
  2. 左側のサイドバーで Skill Catalog をクリックします。
  3. 文書タイプでスキルを参照または検索します。
ロックアイコンまたは「読み取り専用」ラベルが付いているスキルは Base Skills です。 Skill Catalog showing built-in base skills

Base Skill でできること

  • そのまま直接使用して、Process skill のワークフローで利用できます。設定は不要です。
  • field、検証、または認識設定をカスタマイズする必要がある場合は、そこからDerived Skill を作成できます。
Base Skill の名前変更、再トレーニング、内部設定の変更はできません。

Derived Skills

Derived Skill とは

Derived Skill は、Base Skill を完全にコピーした編集可能なものです。Skill を派生させると、事前学習済みの抽出ロジック、field 定義、認識設定をすべて引き継いだうえで、それらを自由にカスタマイズできます。

Derived Skill を使用する場合

次のような場合は Derived Skill を使用します。
  • 対象の文書タイプに対応する Base Skill はあるものの、要件に完全には合致しない場合。
  • フィールドを追加、削除、または名前変更する必要がある場合。
  • バリデーションルールや信頼度のしきい値を調整したい場合。
  • ABBYY の事前学習の利点を活かしつつ、その上に独自の設定を加えたい場合。

Derived Skill の作成方法

  1. 左側のサイドバーで、Skill Catalog をクリックします。
  2. 派生元にする Base Skill を見つけます。
  3. そのスキルをクリックして詳細ページを開きます。
  4. Create and Edit Derived Skill をクリックします。 Create and Edit Derived Skill button
  5. Create and Edit Derived Skill をクリックします。
Second Create and Edit Derived Skill button スキルがエディターで開きます。
  1. 開始するには、Document をアップロードするか、ドラッグ&ドロップします。
  2. 次の操作を行えます:
    • 抽出する fields の追加または削除
    • field ラベルと検証ルールの変更
    • 認識設定の調整
    • 必要に応じた追加のトレーニング用 Document のアップロード
  3. スキルの編集が完了したら、Train. をクリックします。
Skill Designer Train button
  1. トレーニングが完了したら、Publish をクリックして、そのスキルを Process Skills で使用できるようにします。
Skill Designer Publish button

Base Skill が更新されたときに Derived Skill を更新する

ABBYY が Base Skill の更新版をリリースしても、Derived Skill にその変更は自動的には反映されません。更新を適用するには、次の手順に従います。
  1. Skill Catalog で、Derived Skill のバージョン番号の横にある更新アイコンを探します。
  2. 更新アイコンをクリックして Update を選択するか、Derived Skill を開いて settings アイコンをクリックし、base skill の最新バージョンを選択して Save をクリックします。
  3. Derived Skill は自動的に再トレーニングされます。Skill をテストし、必要に応じて調整します。
  4. Publish をクリックして、更新したバージョンを利用可能にします。
更新後の抽出結果に満足できない場合は、Skill を公開しないでください。代わりに、Skill Catalog でその Skill を選択し、Discard changes をクリックして以前のバージョンを使用します。

New Skills

New Skill とは

New Skill は、Skill Designer を使用して完全にゼロから構築します。事前学習済みのベースはなく、fields を定義し、トレーニング用ドキュメントをアップロードし、データにラベル付けして、モデルを自分でトレーニングします。

New Skill を使用するケース

次の場合は、New Skill を使用します。
  • 対象の文書タイプに対応する Base Skill が存在しない。
  • 文書のレイアウトが大幅にカスタマイズされている、または独自仕様である。
  • 抽出モデルを完全に制御する必要がある。

New Skill の種類

Skill TypeUse For
Document SkillDocument から構造化データの fields を抽出する
Classification SkillDocument を種類ごとに分類する
OCR SkillDocument 画像からテキストを抽出し、PDF、DOCX などの形式に結果をエクスポートする — 認識言語、手書き文字、画像の前処理、バーコード検出のオプションあり
Splitter Skill複数 Document ファイル内のページの流れを、後続処理のために個別の Document に分割する
Process Skill分類、抽出、レビュー、エクスポートのアクティビティを組み合わせた、エンドツーエンドの Document ワークフローを統括する

新しい Document Skill を作成する方法

  1. Skill Catalog で、ツールバーの Create ボタンをクリックします。
  2. 表示されたメニューから Document Skill を選択します。 Skill Designer Create dialog showing skill type options
  3. スキルの名前と、必要に応じて説明を入力します。
  4. Create をクリックして、Skill Designer エディターを開きます。
  5. Documents タブで、トレーニング用のサンプル Document をアップロードします。まずは 1 つの Document の fields にラベルを付けます。より多様な例を追加するほど、精度が向上します。
  6. Editor タブで、ラベル付けツールを使用して、各 Document から抽出する fields を指定し、タグ付けします。
  7. Actions ペインで Train をクリックし、ラベル付けしたデータから抽出モデルを構築します。
  8. 抽出精度を確認し、誤りを修正して、結果に満足できるまで手順 5~7 を繰り返します。
  9. 結果が要件を満たしたら、Publish をクリックします。
トレーニング用 Document の数が多く、種類が豊富であるほど、抽出モデルの精度は高くなります。

判断ガイド

適切なアプローチを選ぶには、このガイドを使用します。
  1. ABBYY に、お使いの Document タイプ向けの事前構築済みスキルはありますか?
    • Skill Catalog を確認します。
    • ある場合 → Base Skill から始めます。Process Skill で直接使用します。
  2. Base Skill はそのままで十分に機能しますか?
    • はい → Base Skill をそのまま使用します。カスタマイズは不要です。
    • いいえ (fields が不足している、検証が正しくない、レイアウトが一致しない) → Derived Skill を作成します。
  3. お使いの Document タイプ向けの Base Skill がありませんか?
    • その場合 → Skill Designer で New Skill を作成します。
要するに:
SituationRecommended Approach
ABBYY has a skill and it worksBase Skill
ABBYY has a skill, but it needs tweaksDerived Skill
No suitable Base Skill existsNew Skill

まとめ

  • Base Skills は事前学習済みですぐに使用できますが、編集はできません。
  • Derived Skills は、事前学習済みのロジックを継承した、編集可能な Base Skills のコピーです。
  • New Skills はゼロから構築するもので、独自のトレーニングデータが必要です。
  • 可能であれば Base Skill から始め、必要な場合にのみ派生または新規作成を行ってください。

次のステップ