跳转到主要内容

输入格式

ABBYY Vantage 支持以下图像文件格式作为输入:
  • PDF(*.pdf,包括数字原生文件、扫描件,以及图像下含文本层的扫描件)*
  • GIF(*.gif
  • JBIG2(*.jb2*.jbig2
  • JPEG(*.jpg*.jpeg
  • JPEG 2000(*.jp2*.j2k*.jpf*.jpx*.jpc
  • PNG(*.png
  • TIFF(*.tif*.tiff)。请注意,不支持带有 Alpha 通道或采用 JPEG 压缩的 TIFF 文件。
  • BMP(*.bmp*.dib*.rle
  • PCX(*.pcx*.dcx
  • DOCX(*.docx
  • PPTX(*.pptx
  • XLSX(*.xlsx
仅在 ABBYY Vantage Cloud 环境中支持导入 Office 文件类型。该功能计划在后续版本中为本地部署环境提供。
重要! 如果图像的高度或宽度大于 32512 像素,ABBYY Vantage 将无法打开。
输入图像最佳实践:
  • 以不低于 150 dpi 的分辨率扫描文档,最好不低于 300 dpi。
  • 将原始图像直接传入 Vantage,不要在本地进行任何编辑或预处理。
  • 如果拍摄文档:
    • 确保整页文档完整入镜,不要切到角
    • 尽可能将文档放在平整的表面上
    • 避免强烈阴影和闪光反射
    • 尽量保证对焦均匀,避免文档任何部分出现模糊

输出格式

字段数据可以导出为以下格式:
  • JSON
  • CSV
文档内容可以导出为以下格式:
  • JSON
  • XML
  • ALTOXML
  • TXT
  • DOCX
  • XLSX
  • PPTX
  • HTML
  • 带文本层的 PDF
    • PDF/A-3a
    • PDF/A-3b
文档图像可以导出为不含文本内容的格式:
  • 仅图像的 PDF/A-3b
  • TIFF
  • JPEG

PDF 限制

ABBYY Vantage 无法处理受保护的 PDF 文件(例如设置了密码的 PDF,或禁止复制内容的 PDF)。若需处理此类文件,请使用第三方 PDF 编辑工具先移除这些限制。