概览
- 创建并配置一个 Process 技能
- 为输入和输出设置 SFTP 访问
- 通过命令行上传文档
- 下载提取结果
步骤 1:创建一个 Process 技能
- 在 ABBYY Vantage 中进入 Documents 部分。
- 点击左侧边栏中的 Skill Designer。
- 在技能类型中选择 Process Skill。

- 在 Create Process skill 对话框中输入:
- Skill Name: 为您的流程输入一个描述性名称(例如:“Process Skill Test 1”)
- Description: 可选,对此 Skill 的功能进行说明
- Technology Core Version: 3.0(推荐)

- 点击 Create。
步骤 2:配置 Process Skill 工作流
- 在 Skill Designer 中,您会在右侧看到 Select Process Skill 面板
- 选择 Simple Document skill workflow 来处理单一文档类型

- Input 连接器:文档进入系统的入口
- OCR Skill:光学字符识别(Optical Character Recognition, OCR)
- Extract Skill:数据提取
- Output 连接器:结果输出的出口
Input → OCR → Extract → Output
步骤 3:通过 SFTP 设置输入
- 在工作流中单击 Input 活动。
- 在右侧的 Actions 面板中,选中 Select additional source 复选框。
- 选择 Shared folder 单选按钮。
- 单击 Settings 进行配置。

配置输入设置

- Folder name: Input(默认)
- Import method: Single file
- Folder link:
.../Input - Exceptions folder link:
.../Input-exception - Username: 生成的 UUID(例如
685df03c-9e22-41cb-a96f-4c408ab52735) - Password: 可通过显示/隐藏选项查看
- 单击 Save.
步骤 4:通过 SFTP 设置输出
- 在工作流中单击 Output 活动。
- 在 Actions 面板中,勾选 Select additional destination.
- 选择 Shared folder 单选按钮。
- 单击 Settings 进行配置。

配置输出设置

- 文件夹名称: Output(默认)
- 文件夹:
.../Output - 用户名: 生成的 UUID(例如:
685df03c-9e22-41cb-a96f-4c408ab52735) - 密码: 可通过“显示/隐藏”选项查看
- Fields (JSON): 默认导出格式
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82)。文件会根据数据保留策略自动删除。
- 单击 Save.
步骤 5:配置提取 Skill
- 在工作流中单击 Extract 活动。
- 在 Actions 面板中,将看到 Document Skills。

- Invoice
- Invoice AU-NZ
- Invoice CA
- Invoice ES
- Invoice UA
- Invoice US
- 选择与业务场景相关的文档类型。
- 如需添加其他文档类型,单击 Add Skill。
- 如有需要,使用 Edit Mapping 自定义 field 提取。
步骤 6:发布并获取 Skill ID
- 在 Skill Designer 右上角点击 Publish 按钮。
- 发布完成后,从浏览器地址栏中的 URL 中记录下 Skill ID。

fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c
警告: 请妥善保存 Skill ID——在 SFTP 中访问正确的 Input 和 Output 文件夹时需要用到它。
步骤 7:连接到 SFTP
连接详细信息
- Server:
172.172.228.138 - Port:
2022 - Username: 系统为您生成的 UUID
- Password: 系统为您生成的密码
- Base Path:
/{skill-id}/
通过终端连接
-P(小写 -p 用于其他用途)。
出现提示时,输入密码。
连接成功后,将会看到 SFTP 提示符:
sftp>
查看可用的 Skill

Catalogs- Document skill 目录Catalogs-exception- 导入失败的目录skills-import- Skill 导入目录
- Input - 在此上传要处理的文档
- Input-exception - 导入失败的文档会被移到这里
- Output - 处理完成的结果将显示在这里
步骤 9:上传文档进行处理
上传单个文件

上传多个文件
验证上传结果
第 10 步:检查处理状态
监控 Input-exception 文件夹
等待处理完成
- 文档复杂度
- 已配置的提取 Skill
- 当前系统负载
步骤 11:下载处理完成的结果
了解输出结构
查看结果文件夹内容
- Invoice_US.json - 以 JSON 格式提取的数据
- Invoice_US.csv - 以 CSV 格式提取的数据(如果已配置)
- 其他文件,取决于输出设置
下载结果
了解 JSON 输出
- 文档结构 - 布局和组织方式
- 提取的 field 值 - 从文档中提取的数据
- 置信度评分 - 每项提取结果的可靠性
- 规则错误 - 任何验证问题
- field 元数据 - 关于每个 field 的附加信息
常用 SFTP 命令
| Command | Description | Example |
|---|---|---|
ls | 列出远程文件 | ls |
lls | 列出本地文件 | lls |
pwd | 显示远程目录 | pwd |
lpwd | 显示本地目录 | lpwd |
cd folder | 切换远程目录 | cd Output |
lcd folder | 切换本地目录 | lcd ~/Downloads |
put file | 上传单个文件 | put invoice.pdf |
mput files | 上传多个文件 | mput *.jpg |
get file | 下载单个文件 | get result.json |
mget files | 下载多个文件 | mget * |
get -r folder | 递归下载目录 | get -r results/ |
exit | 断开连接 | exit |
故障排除
连接问题
- 确认已连接到公司 VPN
- 检查端口号(应为
2022,并使用大写参数-P) - 确认用户名和密码是否正确
- 测试基本网络连通性:
ping 172.172.228.138
上传问题
- 检查
Input-exception文件夹中是否有导入失败的文件 - 确认文件格式是否受支持(PDF、JPG、PNG、TIFF 等)
- 确保 Process 技能已发布
- 检查文件大小限制(取决于具体配置)
无输出文件
- 再等待一段时间——处理可能需要 30–60 秒或更长时间
- 确认 Output 的目标已配置为 “Shared folder”(共享文件夹)
- 在 Vantage Web 界面中检查处理事务日志
- 确认 Extract 活动已正确配置相应的 Document Skill
权限错误
- 确认为输入和输出使用了正确的凭据
- 输入凭据允许的操作:上传、删除
- 输出凭据允许的操作:查看、下载、重命名、删除
- 检查该 Skill 是否已发布并处于活动状态
最佳实践
安全性
- 切勿以明文形式共享 SFTP 凭据
- 使用安全通道传输密码
- 定期更换凭据
- 将 SFTP 访问权限仅授予必需的人员
文件管理
- 使用包含日期或 ID 的描述性文件名
- 如有可能,尽量在非高峰时段批量处理文件
- 及时下载并归档处理结果
- 定期清理旧的结果文件夹
监控
- 定期检查 Input-exception 文件夹中的导入失败项
- 监控处理时间以识别瓶颈
- 查看结果中的提取置信度
- 为严重故障设置警报(如可用)
工作流程优化
- 将相似的文档类型归类在一起
- 根据您的用例配置合适的 Document Skill
- 在投入生产使用前,先使用示例文档进行测试
- 为团队参考编写并记录您的 SFTP 工作流程
后续步骤
- 使用各种文档进行测试 - 上传不同类型和格式的文件和文档
- 检查提取准确性 - 查看 JSON 结果和置信度分数
- 自定义提取 - 使用 Edit Mapping 微调 field 提取
- 自动化上传 - 创建脚本以实现文件上传自动化
- 与系统集成 - 通过 Vantage REST API 集成您的应用程序
- 扩展工作流 - 添加更多 Document skill 或创建其他 Process 技能
附加资源
- REST API 文档: 用于通过编程方式上传文件并获取结果
- Skill Catalog: 浏览预构建的 Document skill
- 支持: 联系 ABBYY 支持团队以获取技术支持
总结
- ✅ 在 ABBYY Vantage 中创建了一个 Process 技能
- ✅ 配置了用于输入和输出的 SFTP 访问
- ✅ 设置了文档提取技能
- ✅ 通过 SFTP 命令行完成连接
- ✅ 上传了待处理的文档
- ✅ 下载了提取结果
