メインコンテンツへスキップ
ABBYY Vantage では、処理結果および Optical Character Recognition (OCR) の結果は JSON と XML 形式で取得できます。 Vantage は、適用された Skill と、Process skill を使用している場合は Output activity の設定に応じて、処理済みドキュメントごとに個別の JSON または XML ファイル、あるいはそれらのファイル セットを生成します。 次の表は、Vantage で利用可能な出力ファイルの種類を説明したものです。これらすべてのファイル種別は、Vantage API の ResultFileType 列挙体の一部です。
File typeDescription
Json抽出されたデータ。たとえば、field 値、field 構造、ルールチェック エラーなど。
Pdfテキスト レイヤーの有無を問わない PDF ドキュメント。
TextTXT 形式の抽出されたテキスト データ。
DocxDOCX 形式の抽出されたテキストおよび画像データ。
XlsxXLSX 形式の抽出されたテキストおよび画像データ。
OcrJsonJSON 形式の全文認識データ。
FieldsJson簡略化された JSON ファイル。field 値とルールチェック エラーのみを含みます。
FieldPictureJPG 形式の抽出された画像 field。
Xml抽出された全文認識データ。
TiffTIFF 形式の抽出された画像データ。
JpegJPG 形式の抽出された画像データ。
Csv繰り返し/非繰り返しの field の抽出されたデータ値。
HtmlHTML 形式の抽出された全文認識データ。
PptxPPTX 形式の抽出されたテキストおよび画像データ。
AltoALTO 標準、スキーマ バージョン 4.2 に準拠した XML 形式の抽出された全文認識データ。
Vantage API を使用する場合は、GET https://your-server/api/publicapi/v1/transactions/transaction-id リクエストを使用して、処理済みトランザクションの出力ファイルに関する情報を取得できます。ファイル種別は、resultFile 配列内の各オブジェクトの type プロパティに含まれています。 ファイル種別の詳細については、Output activity および Image(FieldPicture)を参照してください。