跳转到主要内容
ABBYY Vantage Documentation home page
简体中文
Search documentation...
⌘K
Website
Get Started
Get Started
搜索...
Navigation
用例
从文档中提取数据
文档
操作指南
API 使用指南
私有云
介绍
关于 ABBYY Vantage
快速入门
为文档选择合适的技能
更改用户界面语言(Vantage 2.7.3)
技能目录
技能目录
派生技能
内置技能
技能版本
Technology Core 版本
Skill Designer
使用 Skill Designer
分类技能
文档技能
流程技能
OCR 技能
技能设计与管理
技能参数
转换 FlexiCapture 项目
Advanced Designer
关于 ABBYY Vantage Advanced Designer
快速入门
用例
用例
从文档中提取数据
处理半结构化文档
处理结构化文档
处理非结构化文档
处理混合文档集和结构混合的文档
将页面流拆分为独立文档
编辑在 Vantage 中创建并训练的技能
安装并运行 ABBYY Vantage Advanced Designer
文档技能
活动
标注文档
技能版本
升级到新的 Technology Core 版本
在本地存储技能
教程
运行时指南
人工审核客户端
在线学习
技能监控
分析仪表板
租户管理员指南
租户管理
订阅
安全
架构
技术规格
诊断
Scanner Station 用户指南
关于 ABBYY Vantage Scanning Station
安装和运行
主窗口
操作员模式
管理员模式
用户界面
附录
开发人员指南
开始使用 Vantage API
身份验证
文档处理
集成人工审核
使用注册和技能 Parameter
获取事务列表
使用 Vantage API 从移动设备上传文档
报表功能
输出文件类型
发行说明
ABBYY Vantage 3.0
在此页面
文档类型
结构化文档
半结构化文档
非结构化文档
混合文档集
用例
从文档中提取数据
创建文档技能,从结构化、半结构化和非结构化文档中提取数据。
要从文档中提取数据,请创建一个文档技能。
所涉及的场景和技术(以活动形式提供)在很大程度上取决于你所要处理的文档结构。通常情况下,文档可以分为以下几种类型:
文档类型
结构化文档
结构化文档
(也称为固定表单)始终包含相同的信息,并且具有相同的布局,或仅有极少数几种不同的布局。结构化文档的示例包括表单、问卷和调查。
半结构化文档
半结构化文档
通常包含相同的信息,但字段的位置、大小和数量可能会因文档而异,这会增加数据提取的难度。Vantage 将依赖某些元素和字段之间的空间和逻辑关系来定位并提取所需数据。半结构化文档的示例包括发票、付款指令以及提单。
如果您的文档集由结构化或半结构化文档组成,请参阅
处理结构化文档
和
处理半结构化文档
章节中的相关场景。
非结构化文档
非结构化文档
由自由格式文本构成,这些文本被划分为段落和句子,其中包含需要提取的数据。在某些非结构化文档中,一个字段可能会溢出到下一页。非结构化文档的示例包括合同、电子邮件和研究文章。
如果您的文档集由非结构化文档组成,请参阅
处理非结构化文档
部分中的相关场景。
混合文档集
如果文档集中同时包含半结构化和非结构化文档,或者单个文档中既包含半结构化内容又包含非结构化内容(例如纯文本段落与表格交替出现),请参阅
处理混合文档集和混合结构文档
一节中的相关场景。
此页面对您有帮助吗?
是
否
用例
处理半结构化文档
⌘I