跳转到主要内容
ABBYY Vantage 支持以下图像文件格式作为输入:
- PDF(
*.pdf,包括数字原生文件、扫描件,以及图像下含文本层的扫描件)*
- GIF(
*.gif)
- JBIG2(
*.jb2,*.jbig2)
- JPEG(
*.jpg,*.jpeg)
- JPEG 2000(
*.jp2,*.j2k,*.jpf,*.jpx,*.jpc)
- PNG(
*.png)
- TIFF(
*.tif,*.tiff)。请注意,不支持带有 Alpha 通道或采用 JPEG 压缩的 TIFF 文件。
- BMP(
*.bmp,*.dib,*.rle)
- PCX(
*.pcx,*.dcx)
- DOCX(
*.docx)
- PPTX(
*.pptx)
- XLSX(
*.xlsx)
仅在 ABBYY Vantage Cloud 环境中支持导入 Office 文件类型。该功能计划在后续版本中为本地部署环境提供。
重要! 如果图像的高度或宽度大于 32512 像素,ABBYY Vantage 将无法打开。
输入图像最佳实践:
- 以不低于 150 dpi 的分辨率扫描文档,最好不低于 300 dpi。
- 将原始图像直接传入 Vantage,不要在本地进行任何编辑或预处理。
- 如果拍摄文档:
- 确保整页文档完整入镜,不要切到角
- 尽可能将文档放在平整的表面上
- 避免强烈阴影和闪光反射
- 尽量保证对焦均匀,避免文档任何部分出现模糊
字段数据可以导出为以下格式:
文档内容可以导出为以下格式:
- JSON
- XML
- ALTOXML
- TXT
- DOCX
- XLSX
- PPTX
- HTML
- 带文本层的 PDF
文档图像可以导出为不含文本内容的格式:
ABBYY Vantage 无法处理受保护的 PDF 文件(例如设置了密码的 PDF,或禁止复制内容的 PDF)。若需处理此类文件,请使用第三方 PDF 编辑工具先移除这些限制。