メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

新機能

Built-In SkillのコピーをDerived Skillに更新

以前のバージョンのVantageでは、組み込みSkillの編集可能なコピーを作成できました。このバージョンでは、これらのコピーを更新するとTechnology Coreも更新され、コピーはDerived Skillに変換されます。SkillのコピーをDerived Skillに変換すると、今後ベースとなるSkillの新しいバージョンがリリースされた際にも、簡単かつシームレスに更新できるようになります。 組み込みSkillのコピーをDerived Skillに変換すると、変換の結果として発生した変更の一覧が表示されます。変換後は、コピーに加えた変更の一部がリセットされます。たとえば、Derived Skillでは変更が許可されていないfield 構造やfield propertiesなどです。 更新が完了したら、新しいSkillを慎重に確認してください。特に、有効になっているすべてのfieldのラベル付けを確認してください。更新後のSkillを確認して調整しても、なお期待する結果が得られない場合は、公開せずに、次回のTechnology Core更新が利用可能になるまでそのコピーを引き続き使用できます。Technology Coreが更新されると、以前のバージョンはサポートされなくなるため、Skillを更新する必要があります。

新規Skill

既存の組み込み Skill の更新

  • 請求書:
    • Ship To グループが、Invoice CN Skill を除くすべての請求書用 Skill に追加されました。
  • 購買注文書:
    • イタリアおよびオランダの購買注文書の処理がサポートされるようになりました。
    • フランスの購買注文書における抽出の問題が修正されました。
    • Total AmountNet Amount が同一の場合、Total Amount の値を Net Amount にコピーする新しいルールが追加されました。
  • Form 1040, US Individual Income Tax Return:
  • 個人給与明細書:
    • Employer’s Phone Number フィールドが追加されました。
  • Lease Agreement:
    • より多くの文書での学習により、Lease Agreement Skill の精度が向上しました。
  • Receipt CJK:
    • 日本語のレシートで手書き文字認識が利用できるようになりました。

Vantage と Advanced Designer のユーザーインターフェースの更新

Vantage と Advanced Designer のユーザーインターフェースが改善され、Skill の更新がより簡単かつ直感的に行えるようになりました。
  • 更新のたびに、変更内容と必要な操作の詳細な概要が新たに表示されるようになり、更新プロセスがより分かりやすくなりました。
  • field 名と型を変更する機能が追加されました。これらの変更は、Skill のコピーと Derived Skill の両方の更新時に保持されます。
  • What’s New field が追加され、各 Skill のバージョンにおける最新の更新内容を確認できるようになりました。

Process Skill

  • エクスポート前に field を墨消しする 処理済み画像をエクスポートする前に、特定の field を墨消しできる新機能が追加されました。これにより、機密情報や秘密情報を完全に削除できます。墨消しされた field は、エクスポート後の画像では黒く塗りつぶされた領域として表示されるため、機密情報を保護したまま画像を保存またはアーカイブできます。墨消しされたデータは、PDF ファイルのテキスト レイヤーから復元したりコピーしたりすることはできません。
  • カスタム アクティビティに必要なファイルを設定する これまで、カスタム アクティビティでは、抽出されたすべてのデータを含む JSON ファイルと、元の画像を含む検索可能な PDF が作成されていました。現在は、Document の field、テキスト、画像について、外部システムに送信する形式を選択できます。これにより、カスタム アクティビティで JSON ファイルや PDF ファイルが不要な場合、処理時間を短縮できます。また、カスタム アクティビティには JSON や PDF だけでなく、追加のエクスポート形式も指定できるようになりました。

モバイル入力

  • Vantage Mobile Input への短縮リンク Vantage Mobile Input で短縮リンクがサポートされるようになり、開発者はネイティブアプリケーションにより簡単に統合できるようになりました。また、ユーザーは Vantage Mobile Input のマイクロアプリケーションにより簡単にアクセスできるようになります。短縮リンクによりモバイルデバイスとの互換性が向上し、ユーザー体験も改善されます。

監視とレポート

  • Analytics GUI 新しいAnalyticsサービスは、Analytics Reporting Warehouseから、選択したProcess skillの処理が完了したトランザクションに関する詳細情報を取得し、Analyticsページに表示します。処理が完了したトランザクションに関する情報は、サマリー、グラフ、ドーナツチャートの形式で表示され、完了から数分以内に利用できるようになります。新しいAnalyticsサービスにより、データの取り扱いが簡素化され、文書処理の効率が向上します。

業務プロセスのレポート

  • 特定の期間を指定可能 Vantage API で Warehouse からデータレポートをダウンロードする際に、特定の期間を指定できるようになりました。指定した期間内に完了したトランザクションイベントのみがダウンロードされます。
  • ドキュメント数とページ数に関する情報 Warehouse のデータレポートに、完了したトランザクションに含まれるドキュメント数とページ数の情報が含まれるようになりました。
  • 大規模なデータレポートのダウンロード Vantage API で、データレポート用のデータを非同期で収集できるようになりました。これにより、Warehouse のデータレポートを複数のファイルに分割できるようになります。すべて取得するには、各ファイルに対して request を送信する必要があります。この変更は、極めて大きなデータレポートが原因で発生する障害を防ぐことを目的としています。

失敗したトランザクションを再開する機能

この機能により、Processing Supervisors は、外部システムが一時的に利用できない場合や偶発的な処理エラーなどが原因で失敗したトランザクションを再開できます。再開したトランザクションでは、関連するすべてのパラメーターとドキュメントを保持したまま、ソースファイルが先頭から処理されます。

Vantage の管理

ABBYY Vantage Advanced Designer

Skill で LLM を利用できるようになりました

新しいプロンプトベースのアクティビティが導入され、Document skills 内で外部の大規模言語モデル (LLM) を使用できるようになりました。このアクティビティでは、外部 LLM をいくつかの方法で活用できます。
  • 他のアクティビティで抽出したドキュメントの field、テキスト、画像を、LLM 向けのプロンプトで利用できます。たとえば、財務レポートをアップロードして特定の財務指標 (EBITDA や純利益など) を抽出し、Extraction Rules activity でデータを抽出したうえで、LLM を使って予測値と比較できます。
  • LLM が生成した出力は、Vantage のアクティビティを使ってさらに処理、検証、修正できます。たとえば、抽出データをデータ カタログに照らして検証することで、LLM のハルシネーションの影響を抑えることができます。

少ない文書数でも深層学習が可能に

最少10件の文書で学習を実行できるようになりました。ただし、文書数が500件未満の場合は、引き続き警告が表示されます。少ない文書数による影響を軽減するために事前定義の重みを使用できますが、深層学習で十分な品質を得るには、依然として学習用に相当数の文書が必要です。

Advanced Designer の高度な精度レポート

Skill のテスト後、以下の高度な統計情報を利用できるようになりました。
  • field 値の抽出における Skill の品質: Field PrecisionField RecallField F-measure
  • field region の検出における Skill の精度: Region PrecisionRegion RecallRegion F-measure
  • 参照ラベル付けに含まれる field インスタンス数。
  • 指定した field を含むドキュメントの割合。

NLP抽出ルール: 繰り返しfieldのサポート

このリリース以降、NLP抽出ルール内に複数のfieldインスタンスを追加できるようになりました。抽出された要素のすべてのインスタンスは、Properties pane の Result セクションに表示されます。

新しいNLP言語と地域

Address Parsing アクティビティで、イタリアの住所を解析できるようになりました。

主な改善点

OCR技術の改善

OCR技術に、以下の改善が加えられました
  • 製品に統合された新しいe2eモデルにより、中国語およびタイ語のOCR品質が向上しました。これは、Technical Coreバージョン3.0で実行されるすべてのSkillに影響します
  • 契約書、請求書、財務文書、数式などの文書に対するテーブル検出が改善されました。

データ カタログ ルックアップ ルールの改善

データ カタログ ルックアップ ルールに、次の改善が加えられました。
  • field 値について、先頭の単語だけでなく、任意の単語の任意の部分に一致するデータ カタログ レコードを検索できるようになりました。
  • データベース ルックアップに使用される field には、手動入力だけでなく、スクリプト、アクティビティ (Script や NLP activity など) 、およびルールによっても値を設定できるようになりました。このリリース以降、手動確認中に field 値が変更されると、データ カタログ ルックアップ ルールが再度実行されます。対応するレコードが見つかると、その field は読み取り専用になります。

修正

Vantage リリース 3.0 では、以下の問題を修正しました。

Vantage の管理

  • Azure AD SAML 用の外部 ID プロバイダーを設定すると、ユーザーがすでに外部 ID プロバイダー経由でシステムに認証されている場合でも、毎回ログインを求められていました。(598355, 552880, 571969, 597296)
  • 認証に外部 ID プロバイダーを使用している場合、Advanced Designer でテナントを切り替えられませんでした。(599410)
  • テナントで IP 制限が有効になっているにもかかわらず、許可リストに登録されていない IP アドレスのユーザーでも Vantage にログインできていました。(604762)

Advanced Designer

  • Advanced Designer の Extraction Rules アクティビティで Code Editor を使用すると、Internal Program Error: \\AwlVantageControls\\Src\\LayoutTabControl.cpp, 523 が発生していました。(601875)
  • 別の Skill からラベル付けをインポートすると、明細の形式が "table" から "repeating group" に意図せず変更されていました。(588121)
  • Advanced Designer で特定のドキュメントをアップロードすると、Internal Program Error: ../DAForms/DAForms.HighLevel/Src/BlockResult.cpp, 203 が発生していました。(596699)
  • Skill に Extraction Rules アクティビティを追加すると、アクティビティ エディターを開いたときに無効化されていたfieldsが有効になっていました。(600707)
  • Advanced Designer でアップロードした大規模なドキュメントセットで、パフォーマンスの低下や失敗が発生していました。(597783)
  • Advanced Designer には、すべての Skill のバージョンを表示するためのスクロールバーがありませんでした。(595916)
  • Extraction Rules アクティビティで画像が認識されませんでした。(594091)
  • Advanced Designer で、繰り返しグループ要素の順序が正しくありませんでした。(582314)
  • Advanced Designer の All Documents ペインで、削除する複数のドキュメントを選択できませんでした。(582313)
  • Advanced Designer でドキュメントのアップロードに問題がありました。(581111)
  • 出力チェックボックスがオフでも、field の FastML 値が設定されていました。(576466)
  • Advanced Designer で、Rename Dataset ダイアログがスクロールバーのオフセット分だけずれてデータセットの下に表示されていました。現在は、Rename Dataset ダイアログがデータセット名の位置に表示されます。(567358)
  • Advanced Designer で、Invoice US Skill (Technology Core 2.4) が Vendor ID field の正しい値を抽出していませんでした。(591210)

Air Waybill Skill

  • Air Waybill Skill の使用時に、一部のドキュメントで Flight fields および Flight Date fields が見つかりませんでした。(577333)
  • Air Waybill Skill の使用時に、一部のドキュメントで Carrier Country field が誤って抽出されました。(601791)

組み込み Skill、Fast Learning Activity

  • Skill に Fast Learning Activity を追加した後でその Skill を再学習すると、組み込み Skill 内の fields の抽出品質が低下していました。(598328)

名刺 Skill

  • 日本語の一部の名刺で、個人名が組織名として抽出される問題を修正しました。(564779)

分類Skill

  • アップロードしたドキュメントの一部が、分類Skillのドキュメントセットから消えてしまう問題を修正しました。 (581895)
  • 分類Skillを使用して一部のドキュメントを処理すると、Max activation count for step exceeded エラーが発生する問題を修正しました。 (585456)
  • 既定の分類Skillが一部のドキュメントで正しく動作しない問題を修正しました。 (581726)

Commercial Invoice Skill

  • パイプ記号とアンダースコアが抽出されない問題を修正しました。(549374)

データ カタログ

  • “Data Catalog Lookup” ルールで、“Document Issuer Company” 型のデータ カタログを使用している場合、値が認識されていなくても値が取得されていました。(576583)
  • データ カタログの CSV ファイルを SFTP 経由でアップロードした場合、データ カタログの更新が正しく機能していませんでした。(584710, 585050)
  • 有効なファイルでデータ カタログを更新した際に、Invalid data in CSV file エラーが発生していました。(600635)
  • データ カタログ内に重複レコードがあると、エラー メッセージが表示されないまま、レコードが見つからなくなっていました。(581746)
  • Skill でデータ カタログを使用していない場合でも、手動確認中にデータ カタログ検索のポップアップが表示されていました。(583091)

Document skill

  • 一部のSkillは、学習のキャンセル後に応答しなくなることがありました。(597478, 598648, 599991)
  • Skillを編集したユーザーに対して、そのSkillがロックされることがありました。(594866)
  • Document skillは、開く、公開する、またはエクスポートしようとすると応答しなくなることがありました。(599067, 599582, 599892, 599991, 600169, 602816)
  • 大規模なSkillの更新時に、メモリ不足エラーが発生することがありました。(579890)
  • 固定フォーム文書向けに設計されたDocument skillでテーブルのラベル付けを行う際に、テーブルのセルが消えることがありました。(582447)
  • 末尾にマイナス記号が付いた負のfield valuesが、正の値として扱われていました。(581898, 583978)
  • タイ語と英語言語の両方を有効にすると、新しく作成されたDocument skillsでsymbolを認識できませんでした。(603748)
  • 大きな文書の処理時に、トランザクションがエラーで失敗していました。(587435)
  • Document skillsの抽出精度が低下していました。(577537)
  • 一部のテキストが正しく抽出されませんでした。(577166)
  • Document skillの編集中に文書をアップロードできませんでした。(582452)
  • 無効化されたfieldsが、精度が計算される結果の概要に含まれていました。(566879)
  • 縦書きテキストをDocument skillsで認識および抽出できませんでした。(501694)

Skill のエクスポート

  • 100 件を超える文書を含む Process skills は、“Export with embedded skills” オプションがオフの場合、ローカルマシンにエクスポートできませんでした。(594063)
  • エクスポートされたファイル内で、画像領域の Rect 座標がエクスポートされたページの幅と高さを超えていました。(571790)

手書き文字OCR

  • 手書き文字OCRが一部の文書で正常に機能しませんでした。(593302)
  • 学習後、手書き文字の抽出時に先頭の文字が欠落し、不正確な結果が生成されました。(572998)
  • テーブルの異なる行にある手書き文字が1つの単語として表示され、不正確な結果が生成されました。(572996)

ドキュメントのインポート

  • 特定のPNGファイルのインポート時に、Cannot open the image file. The file may be corrupted. エラーが発生していました。(602971)
  • ベクターPDFをVantageにインポートすると、画質が低下していました。(581372)

Skillのインポート

  • Process skillのインポート時に、Vantageで埋め込まれたSkillの処理方法をユーザーが選択できました。(568806)

Invoice Skill

  • 必須のキーワードが含まれているにもかかわらず、一部のクレジットノート文書がそのように識別されませんでした。(567399)
  • Invoice Skill の使用時に、一部のデジタル生成 PDF から請求書番号 fields および請求日 fields が抽出されませんでした。(587417)
  • Invoice Skill の使用時に、一部の文書から Bank Code fields が抽出されませんでした。(575741)
  • 請求書用 Skill の許容日付 fields に 0 を入力できませんでした。0 を入力すると、将来日付の請求書が処理されないようにできます。(563263)

Invoice CN Skill

  • 中国語のデータ抽出品質に関する問題。 (493023)

Invoice JP Skill

  • Invoice JP Skill の使用時に、一部の文書で「合計金額」field が抽出されないことがありました。(597732)

Invoice UA Skill

  • Invoice UA Skill の使用時に、一部のドキュメントから Quantity fields および Unit Price fields が抽出されない問題を修正しました。(586336)

手動確認

  • ある文書から別の文書にページを移動する際、手動確認中に断続的な問題 (黒い画面が表示される、画像のロードが終わらないなど) が発生していました。(586235)
  • Process skill に複数の手動確認ステージがある場合、最初の手動確認ステージで処理されたトランザクションが 2 番目の手動確認ステージにルーティングされると、手動確認リンクからでも Skill Monitor 経由でも、レビュー インターフェイスでそのトランザクションを開けなくなっていました。(603366)
  • 手動確認中、文書タイプのリストがアルファベット順に並んでいませんでした。(588131)
  • 手動確認中にデータ カタログからレコードを手動で選択しても、No records found エラーが表示されたままでした。(601613, 600781)
  • 手動確認では、Field ペインのサイズ変更がしづらい状態でした。(590746)
  • 手動確認では、Document skill が保険契約によって削除されると、トランザクションが失敗していました。(587960)
  • 手動確認が完了した後に手動確認リンクをもう一度クリックすると、一般的なエラー メッセージが表示されていました。このエラー メッセージが改善されました。(585573)
  • 手動確認で field region を手動で描画すると、領域が値全体に重なっていなくても完全な値が抽出されていました。(562061)
  • 手動確認中、文書内の field region に基づいて field values が自動入力されていませんでした。(561595)
  • 手動確認でトランザクションを開けない問題がありました。(611592)

購買注文書 Skill

  • ページ上のテキストの一部が認識されなかったか、誤って認識されていました。(566393)
  • 別の合計金額 field に同じ数値が含まれている場合、Subtotal/Goods Total field の値が正しくありませんでした。(594464)
  • 購買注文書 Skill を使用した場合、フランス語の文書から一部のデータが抽出されませんでした。(576291)

OCR

  • 一部の文書で、field values が誤って抽出されていました。 (589314)
  • 明細からデータを抽出する際に、不要な文字が混入することがありました。 (547197)
  • 画像の upload メソッドが認識結果に影響することがありました。 (580169)
  • 一部の文書の処理中に、ProjectiveTransformationParams.cpp, 100 の内部プログラム エラーが発生していました。 (585333)
  • RTL 言語 (たとえば、ヘブライ語やアラビア語) を含む一部の文書で、単語順が誤って認識されていました。 (462151, 580752)
  • 一部の文書の処理中に、Internal program error:../FineObjects/Inc/Object.h, 360. が発生していました。 (598221)
  • 一部のアラビア語文書から明細を抽出する際に、最初の row が反転していました。 (595150)
  • 一部の文書で、数値が認識されないか、誤って認識されていました。 (589175, 603681)
  • 一部の文書の処理中に、Max activation count for step exceeded エラーが発生していました。 (602331)
  • 一部の日本語文書の処理時に、日付が誤って認識されていました。 (584518)
  • タイ語文書の処理時に、コンマがドットとして認識されていました。 (567178)
  • 全文 OCR の実行中に、コントラストの低いテキストが認識されないか、誤って認識されていました。 (544424)
  • フォーム上の標準的な checkmarks が検出されていませんでした。 (460241)
  • field region を手動で描画した際に、RTL 言語の複数単語から成るテキストが誤った順序で表示されていました。 (443616, 580184, 525296, 492170, 579355)
  • field の数値の後に負符号がある場合、その負符号が抽出されていませんでした。 (584492)
  • 文書上で値が見つからない場合、field は空欄のままではなくデータで埋められていました。 (570252)
  • field region を手動で描画した場合には正しくても、値が誤って認識されていました。 (565943)
  • 抽出時に通貨記号が認識されていませんでした。 (564681)
  • 「get value from data catalog」オプションを使用した際に、Catalog の record が抽出されていませんでした。 (564011)

OCR Skill

  • OCR Skillでドキュメントを処理し、「Export to PDF」オプションを有効にしていると、出力PDF内のバーコードがバーコードスキャナーで読み取れなくなる問題を修正しました。(564727)

Process Skill

  • Classify アクティビティを含む “For-each” ブロックがある Process skills で、手動確認中に文書タイプを変更すると、エクスポートされた JSON ファイルの “ResultClass” 値が null に設定されていました。(592498)
  • Skill Monitor でインポートが無効になっている場合、Input アクティビティの設定に Import is disabled for this skill. という警告が表示されませんでした。(597789)

レポートサービス

  • Reporting サービスで、Technology Core バージョン 2.0 ベースの Skill に対する NumberOfChangedFields 列の値が誤って返されていました。(597754)
  • startDate および endDate の値を指定した /transaction-steps リクエストで、指定範囲外のトランザクションが返されていました。(586394, 588878)
  • /process-skills/fields および /process-skills/documents リクエストが、Tenant mapping not found for tenant. エラーで失敗していました。(605418)
  • API を使用してレコード数が多すぎるトランザクションレポートを抽出すると、504 Gateway Time-out エラーが発生していました。(593394, 604392)

海上運送状 Skill

  • 海上運送状 Skill にサンプルを追加して Skill を再学習すると、Containers テーブル field の精度が低下していました。(582982)
  • デフォルトの海上運送状 Skill の抽出品質が低すぎました。(581472)

Skill Monitor

  • 結果が1ページに収まる件数を超える場合、検索機能が正しく動作しませんでした。(592619)
  • 一部のトランザクションは、キャンセルされても Skill Monitor 上でステージが変更されませんでした。(570696)

学習

  • Document skills の学習が、Could not update report, because workflow failed エラーにより失敗することがありました。(580332)
  • 一部の fields が無効になっている場合、Derived Skill の学習が失敗していました。(588035)
  • 一部の Skill の学習時に、Managed interop delegate failed in /DEV_ROOT/0/OcrtWorker/Native/Interop/Src /Exports/InteropStorageAccess.cpp:23 エラーが発生していました。(594034)
  • Skill の削除された編集可能バージョンの文書が、その Skill の次の編集可能バージョンから必ずしも削除されていませんでした。(596442)
  • 一部の Skill の学習時に、Max activation count for step exceeded エラーが発生していました。(585137)
  • Skill にサンプルを追加してから再学習すると、一部の fields の精度が低下していました。(569334, 601893)
  • サンプル文書で Skill を学習させた後でも、一部の fields が正しく抽出されませんでした。(597627)
  • サンプル文書で Skill を学習させた後でも、一部の明細が抽出されませんでした。(603240, 583993)

Technology Core

  • 一部のDerived Skillでは、Technology Core バージョン2.4へのアップグレード後に精度が低下していました。(579585)
  • Derived Skillで変更したfieldsのデータ型が、Technology Core バージョン2.4への更新時にBase Skillのデータ型に戻っていました。(605495)
  • Technology Core バージョン2.4に更新した一部のSkillで、テーブルが誤って抽出されていました。(580130)

Vantage ドキュメント

既知の問題

  • Vantage 3.0 の到着通知 Skill では、フランス語およびドイツ語の言語認識がサポートされなくなりました。到着通知 Skill がサポートするのは英語のみです。
  • アカウントを Vantage 2 テナントから Vantage 3 テナントに切り替えた後、ユーザーは Vantage 3 にログインできません。回避策: Vantage 2 と Vantage 3 を同時に使用するには、シークレット ウィンドウで Vantage 3 にログインしてください。

非推奨

ブラウザーから API への直接アクセスはサポート対象外になりました

OAuth クライアント認証情報を使用してブラウザーから API を直接呼び出す方法は、サポート対象外になりました。これを有効にするには、Client ID とシークレットをフロントエンドのコードに埋め込む必要がありますが、そうするとページを検証した人なら誰でもそれらを確認できてしまいます。その結果、悪意のある第三者がアプリケーションになりすまして、不正な API 呼び出しを行うおそれがあります。 推奨事項: バックエンドプロキシを使用してください。フロントエンドは自社のサーバーを呼び出し、サーバー側で認証情報を安全に保管したうえで、API へのリクエストを転送します。これにより、シークレットをブラウザーに一切公開せずに済みます。