跳转到主要内容

输入格式

ABBYY Vantage 支持以下图像文件格式作为输入:
  • PDF(*.pdf,包括电子生成文件、扫描件以及图像下带有文本层的扫描件)*
  • GIF(*.gif
  • JBIG2(*.jb2*.jbig2
  • JPEG(*.jpg*.jpeg
  • JPEG 2000(*.jp2*.j2k*.jpf*.jpx*.jpc
  • PNG(*.png
  • TIFF(*.tif*.tiff)。请注意,不支持带有 alpha 通道且使用 JPEG 压缩的 TIFF 文件。
  • BMP(*.bmp*.dib*.rle
  • PCX(*.pcx*.dcx
  • DOCX(*.docx
  • PPTX(*.pptx
  • XLSX(*.xlsx
Office 文件格式的导入仅在 ABBYY Vantage 云环境中可用。计划在后续版本中为本地部署环境实现此功能。
重要! 如果图像的高度或宽度大于 32512 像素,ABBYY Vantage 将无法打开该图像。
输入图像的最佳实践:
  • 以 150 dpi 或更高的分辨率扫描文档,建议不要低于 300 dpi。
  • 将原始图像直接提交给 Vantage,不要在您这边进行任何编辑或预处理。
  • 如果您通过拍照采集文档图像:
    • 确保整个文档都在图像中,没有边角被裁掉。
    • 如果可能,将文档放在平整的表面上。
    • 避免强烈阴影和闪光灯反光。
    • 力求获得均匀的对焦,避免文档的任何部分出现模糊。

输出格式

字段数据可以导出为以下格式:
  • JSON
  • CSV
文档内容可以导出为以下格式:
  • JSON
  • XML
  • ALTOXML
  • TXT
  • DOCX
  • XLSX
  • PPTX
  • HTML
  • 带文本层的 PDF
    • PDF/A-3a
    • PDF/A-3b
文档图像可以导出为不包含文本内容的格式:
  • 仅图像的 PDF/A-3b
  • TIFF
  • JPEG

PDF 限制

ABBYY Vantage 无法处理受保护的 PDF 文件(例如设置了密码保护的 PDF,或禁止复制内容的 PDF)。若要处理此类文件,请使用第三方 PDF 编辑工具先去除这些限制。