概述
- 创建并配置一个流程技能
- 为输入和输出设置 SFTP 访问
- 通过命令行上传文档
- 下载提取结果
步骤 1:创建流程技能
- 在 ABBYY Vantage 中导航到 文档 部分。
- 点击左侧边栏中的 Skill Designer。
- 在技能类型中选择 Process Skill。

- 在 Create Process skill 对话框中输入:
- Skill Name: 为流程输入一个描述性名称(例如,“Process Skill Test 1”)
- Description: 此技能用途的可选说明
- Technology Core Version: 3.0(推荐)

- 点击 Create
步骤 2:配置流程技能工作流
- 在 Skill Designer 中,你会在右侧看到 Select Process Skill(选择流程技能)面板
- 选择 Simple Document skill workflow(简单文档技能工作流),用于处理单一文档类型

- Input 连接器:文档进入系统的入口
- OCR 技能:Optical Character Recognition(OCR,光学字符识别)
- Extract 技能:数据提取
- Output 连接器:结果输出的出口
Input → OCR → Extract → Output
步骤 3:通过 SFTP 设置输入
- 在工作流中单击 Input 活动。
- 在右侧的 Actions 面板中,选中 Select additional source.
- 选择 Shared folder 单选按钮。
- 单击 Settings 进行配置。

配置输入设置

- Folder name: Input(默认)
- Import method: Single file
- Folder link:
.../Input - Exceptions folder link:
.../Input-exception - Username: 生成的 UUID(例如
685df03c-9e22-41cb-a96f-4c408ab52735) - Password: 可通过“显示/隐藏”选项查看
- 单击 Save.
步骤 4:通过 SFTP 设置输出
- 单击工作流中的 Output 活动。
- 在 Actions 面板中,选中 Select additional destination.
- 选择 Shared folder 单选按钮。
- 单击 Settings 进行配置。

配置输出设置

- Folder name: Output(默认)
- Folder:
.../Output - Username: 自动生成的 UUID(例如
685df03c-9e22-41cb-a96f-4c408ab52735) - Password: 可通过“显示/隐藏”选项查看
- Fields (JSON): 默认导出格式
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82)。文件会根据数据保留策略自动删除。
- 单击 Save.
步骤 5:配置提取技能
- 在工作流中单击 Extract 活动。
- 在 Actions 面板中,可以看到 Document Skills。

- Invoice
- Invoice AU-NZ
- Invoice CA
- Invoice ES
- Invoice UA
- Invoice US
- 选择与当前业务场景相关的文档类型。
- 如需更多文档类型,单击 Add Skill。
- 通过 Edit Mapping 在需要时自定义字段提取。
步骤 6:发布并获取技能 ID
- 点击 Skill Designer 界面右上角的 Publish 按钮。
- 发布完成后,在浏览器地址栏的 URL 中查看并记录 Skill ID。

fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c
警告: 请妥善保存您的 Skill ID;在通过 SFTP 访问正确的 Input 和 Output 文件夹时将会用到。
步骤 7:连接到 SFTP
连接详细信息
- Server:
172.172.228.138 - Port:
2022 - Username: 系统生成的 UUID
- Password: 系统生成的密码
- Base Path:
/{skill-id}/
通过终端连接
-P(小写 -p 用于其他用途)。
根据提示输入密码。
连接成功后,您会看到 SFTP 提示符:
sftp>
查看可用技能

Catalogs- 文档技能目录Catalogs-exception- 失败的目录导入skills-import- 技能导入目录
- Input - 在此上传要处理的文档
- Input-exception - 导入失败的文档会被移到这里
- Output - 处理完成的结果会出现在这里
步骤 9:上传待处理文档
上传单个文件

上传多个文档
验证上传情况
步骤 10:检查处理状态
监控 Input-exception 文件夹
等待处理
- 文档的复杂性
- 已配置的提取技能
- 当前系统负载
步骤 11:下载已处理的结果
了解输出结构
查看结果文件夹的内容
- Invoice_US.json - 以 JSON 格式提取的数据
- Invoice_US.csv - 以 CSV 格式提取的数据(如果已配置)
- 根据输出设置生成的其他文件
下载结果
了解 JSON 输出
- 文档结构 - 布局和组织方式
- 提取的字段值 - 从文档中提取的数据
- 置信度评分 - 每个提取结果的可靠性
- 规则错误 - 任何验证问题
- 字段元数据 - 关于每个字段的附加信息
常用 SFTP 命令
| Command | Description | Example |
|---|---|---|
ls | 列出远程文件 | ls |
lls | 列出本地文件 | lls |
pwd | 显示当前远程目录 | pwd |
lpwd | 显示当前本地目录 | lpwd |
cd folder | 切换到远程目录 | cd Output |
lcd folder | 切换到本地目录 | lcd ~/Downloads |
put file | 上传单个文件 | put invoice.pdf |
mput files | 上传多个文件 | mput *.jpg |
get file | 下载单个文件 | get result.json |
mget files | 下载多个文件 | mget * |
get -r folder | 递归下载目录 | get -r results/ |
exit | 退出 SFTP 会话 | exit |
疑难解答
连接问题
- 确认您已连接到公司 VPN
- 检查端口号(应为
2022,并使用大写参数-P) - 核实您的用户名和密码是否正确
- 测试基本网络连通性:
ping 172.172.228.138
上传问题
- 检查
Input-exception文件夹中是否有导入失败的文件 - 确认文件格式受支持(PDF、JPG、PNG、TIFF 等)
- 确保流程技能已发布
- 检查文件大小限制(因配置而异)
没有输出文件
- 再等一会儿——处理可能需要 30–60 秒甚至更长时间
- 确认已将 Output 配置为“Shared folder”(共享文件夹)目标
- 在 Vantage Web 界面中检查事务日志
- 确认 Extract 活动已配置了适当的文档技能
权限错误
- 确认针对输入和输出使用了正确的凭据
- 输入凭据允许:上传、删除
- 输出凭据允许:查看、下载、重命名、删除
- 检查该技能是否已发布并处于激活状态
最佳实践
安全性
- 切勿以明文形式共享 SFTP 凭据
- 使用安全通道传输密码
- 定期更换凭据
- 将 SFTP 访问权限限制为仅必需的人员
文件管理
- 使用包含日期或 ID 的描述性文件名
- 如有可能,在非高峰时段批量处理文件
- 及时下载并归档结果
- 定期清理旧的结果文件夹
监控
- 定期检查 Input-exception 文件夹中的导入失败记录
- 监控处理时间以识别瓶颈
- 查看结果中的数据提取置信度评分
- 为严重故障设置警报(如可用)
工作流优化
- 将相似的文档类型归类在一起
- 为您的用例配置合适的文档技能
- 在投入生产环境前先使用示例文档进行测试
- 将您的 SFTP 工作流加以记录,供团队参考
下一步
- 使用各种文档进行测试 - 上传不同的文件类型和文档变体
- 检查提取结果的准确性 - 查看 JSON 结果和置信度评分
- 自定义提取 - 使用 Edit Mapping 微调字段提取
- 自动化上传 - 创建脚本以自动上传文件
- 与系统集成 - 通过 Vantage REST API 连接应用程序
- 扩展工作流 - 添加更多文档技能或创建额外的流程技能
其他资源
- REST API Documentation: 用于通过编程方式上传文件并获取处理结果
- 技能目录: 浏览预构建的文档技能
- 支持: 联系 ABBYY 支持团队以获取技术协助
总结
- ✅ 在 ABBYY Vantage 中创建了一个流程技能
- ✅ 配置了用于输入和输出的 SFTP 访问
- ✅ 设置了文档提取技能
- ✅ 通过 SFTP 命令行方式完成了连接
- ✅ 上传了要处理的文档
- ✅ 下载了提取结果
