メインコンテンツへスキップ
次の表では、利用可能な出力 XML ファイルの種類を説明します。Skill type 列には、各 XML ファイルを生成できる Skill の種類が示されています。
File typeExport optionDescriptionSkill typeFile nameXML schema
XMLText onlyこのモードは、低品質な小さなテキスト領域を含め、入力画像内のすべてのテキストを抽出するのに適しています。文書の見た目や構造は考慮されず、画像や表も検出しません。請求書やレシート、インボイスからデータを抽出するなど、画像から取得したデータを後段で処理したい場合に適しています。このモードを選択すると、DOCX と XLSX へのエクスポートはできません。OCR<Source_file_name>.xml **XML schema
XMLText onlyこのモードは、低品質な小さなテキスト領域を含め、入力画像内のすべてのテキストを抽出するのに適しています。文書の見た目や構造は考慮されず、画像や表も検出しません。請求書やレシート、インボイスからデータを抽出するなど、画像から取得したデータを後段で処理したい場合に適しています。このモードを選択すると、DOCX と XLSX へのエクスポートはできません。Process<Applied_skill_name>.xml *XML schema
XMLPreserve document structureこのモードは、フォントスタイル、画像、背景色などを含む元の文書の構造と外観の保持を重視しており、契約書、合意書、仕様書といった文書に適しています。OCR<Source_file_name>.xml **XML schema
XMLPreserve document structureこのモードは、フォントスタイル、画像、背景色などを含む元の文書の構造と外観の保持を重視しており、契約書、合意書、仕様書といった文書に適しています。Process<Applied_skill_name>.xml *XML schema

ファイル命名規則

*<Applied_skill_name> は次のいずれかになります:
  • トランザクションが Document または 分類スキル に対して作成された場合は、その Skill の名前。
  • トランザクションが Process skill に対して作成された場合:
    • ドキュメントに適用された最後の Document skill の名前
    • Document skill が適用されていない場合は、ドキュメントに適用された最後の 分類スキル の名前
    • Process skill のフローに少なくとも一つ存在するにもかかわらず、Document と 分類スキル がいずれも適用されなかった場合は “Unknown”
** <Source_file_name> はドキュメントの組み立てに最初に使用されたファイルの名前です(例: “IMG_12234”)。