Receipt 和 Receipt CJK 技能用于从收据中提取数据。
收据是一种用于确认已支付货物或服务费用的文档。收据通常包含以下信息:
- 已支付费用的货物或服务清单
- 购买货物或服务的地点
- 购买的日期和时间
Receipt 和 Receipt CJK 技能属于生产技能。它们已在大量文档集上进行了充分训练,能够实现高精度的数据识别和提取。这些技能已可直接用于生产环境。通过基于人工参与反馈 (human-in-the-loop) 的持续学习机制,还可以在生产环境中进一步优化准确率和直通式处理 (STP) 率。
Receipt 和 Receipt CJK 技能无法基于额外文档进一步训练。
Receipt 技能能够识别 Tip (小费) 和 Total (合计) 字段中的手写数字。此选项默认启用。如果不导入包含手写数字的表单,请在技能设置中禁用 手写识别 选项。
Receipt CJK 技能能够识别手写文本。此选项默认启用。如果不导入手写表单,请在技能设置中禁用 手写识别 选项。
| 国家 | 语言 |
|---|
| 澳大利亚 | 英语 |
| 比利时 | 荷兰语 |
| 法语 |
| 巴西 | 葡萄牙语 (巴西) |
| 加拿大 | 英语 |
| 法语 |
| 芬兰 | 芬兰语 |
| 法国 | 法语 |
| 德国 | 德语 |
| 匈牙利 | 匈牙利语 |
| 意大利 | 意大利语 |
| 爱尔兰 | 英语 |
| 卢森堡 | 法语 |
| 德语 |
| 墨西哥 | 西班牙语 |
| 荷兰 | 荷兰语 |
| 新西兰 | 英语 |
| 挪威 | 挪威语 (书面语 Bokmål) |
| 巴拿马 | 西班牙语 |
| 秘鲁 | 西班牙语 |
| 波兰 | 波兰语 |
| 塞尔维亚 | 塞尔维亚语 (拉丁文) |
| 新加坡 | 英语 |
| 斯洛伐克 | 斯洛伐克语 |
| 西班牙 | 西班牙语 |
| 加泰罗尼亚语 |
| 瑞典 | 瑞典语 |
| 土耳其 | 土耳其语 |
| 英国 | 英语 |
| USA | 英语 |
| 西班牙语 |
支持的其他语言: 爱沙尼亚语
| 国家 | 语言 |
|---|
| 中国 | 繁体中文 |
| 英语 |
| 日本 | 现代日语 |
| 英语 |
| 韩国 | 韩语 (谚文) |
| 英语 |
| 台湾 | 繁体中文 |
| 英语 |
| Field | 描述 |
|---|
| Expense Type | 费用类型。可能取值:Airfare (机票:已预订航班的收据) 、Car Parking (停车:停车计费设备或停车场的收据) 、Car Rental (租车:汽车租赁服务的收据) 、Gasoline Station (加油站:加油站的收据) 、General Retail (零售:商店、超市等的收据) 、Restaurant (餐厅:餐厅账单) 、Toll Road (收费公路:通行费收据) 、Transport (交通:公共交通费用的收据) |
| Vendor | 开具收据的组织名称。 |
| Address | 开具收据的组织地址。 |
| Phone | 开具收据的组织电话号码。 |
| Date* | 支付发生的日期。 |
| Country | 支付发生所在的国家。 |
| City | 支付发生所在的城市。 |
| Field | Description |
|---|
| 付款方式 | 付款方式。可能的取值:Card、Cash、Transfer、Mixed、Undefined |
| 卡类型 | 用于付款的卡片所属的支付处理网络。可能的取值:Mastercard、VISA、AmericanExpress、NationalCard、Undefined |
| 信用卡或借记卡 | 指明使用的是信用卡还是借记卡。可能的取值:Credit、Debit |
| 卡号 | 用于付款的卡号。卡号中的部分数字可能会以字符 X 进行掩码处理。 |
| 字段 | 描述 |
|---|
| 货币* | 付款所用的货币。 |
| 合计* | 收据上的合计金额。 |
| 小费 | 小费金额。 |
| 税额合计 | 针对该购买征收的税款合计金额。如果 Tax Total 字段为空,则可以由 Process money fields and currency 规则自动填写。 |
| 字段 | 说明 |
|---|
| Taxes | 税项详细信息。如果 Tax Rate 和 Tax Amount 字段为空,则不会显示任何详细信息。如果检测到多种税项,它们会在表格中显示为多行。税额合计将记录在 Tax Total 字段中。 |
| Tax Rate | 税率百分比 |
| Tax Amount | 税额数值 |
已购买商品或服务的列表。
| 字段 | 说明 |
|---|
| Description | 所购产品或服务的名称。 |
| SKU | 产品的库存单位 (SKU) 标识符 (如有) 。 |
| Quantity | 购买的产品数量。 |
| Price | 单价。 |
| Amount | 该行项目的金额合计。 |
要用计算值填充字段,请在相应字段的值区域中单击建议按钮,并从下拉列表中选择一个建议。
| Rule | Description |
|---|
| Process money fields and currency | 将 Total、Tax Total 和 Tax Amount 字段中的金额和货币拆分开来,如果 Currency 字段尚未填充,则将货币复制到 Currency 字段中。检查 Taxes 和 Tax Amount 字段之和是否等于 Total Tax 字段的值。如果数值不相等,则显示错误信息,并建议用计算值填充这些字段。如果未找到 Total Tax 字段的值,则用其计算值进行填充。当 Total Tax 字段的值大于 Total 字段中值的 50% 时,显示警告信息。检查 Currency 字段的值是否为已知的 ISO 货币代码。如果货币未知或尚未提取,则为受支持国家/地区建议货币值。货币描述和符号将被替换为 ISO 代码。 |
| Process Date | 规范化 Date 字段的值。通过 Country 字段的值来消除日期歧义。 |
| Process Taxes | 基于 Tax Rate 和采购净额为 Tax Amount 字段建议一个值,或反向根据 Tax Amount 推算 Tax Rate。这仅在检测到净额时才可能。从 Tax Rate 字段中移除 % 符号,并规范化存在歧义的数值。 |
Receipt 和 Receipt CJK 技能具有默认的技能参数,您可以使用这些参数来调整字段提取。对于某些文档处理场景,您可能希望在 Vantage 或 Advanced Designer 中更改这些参数的取值 (例如,如果您只处理来自特定国家/地区的文档,或所有收据具有相同的通用费用类型) 。如需了解更多信息,请参见 技能参数。
| Parameter | Description |
|---|
| PredefinedCountries | 预定义的国家/地区列表,用于限制对收据的自动国家/地区检测。对于 Receipt 技能,此参数的默认值为空。您可以填写以分号分隔的 ISO Alpha-2 国家/地区代码来指定所需的国家/地区。对于 Receipt CJK 技能,此参数的默认值为 CN; HK; JP; KP; KR; MO; MY; PH; SG; TW。您可以通过删除任何不需要的国家/地区代码来更改此值。此参数的取值主要会影响从 Country、Currency、Tax Total 和 Taxes 字段中提取数据。 |
| PredefinedExpenseType | 预定义的费用类型列表,用于限制对收据的自动费用类型检测。默认情况下,此参数的值为空。您可以填写实际需要处理的费用类型,并以分号分隔。可选值包括:Airfare (机票预订的收据) 、CarParking (停车收费收据) 、CarRental (汽车租赁服务收据) 、GasolineStation (加油站收据) 、GeneralRetail (商店、超市等收据) 、Hotel (酒店收据) 、Restaurant (餐厅账单) 、TollRoad (道路通行费收据) 、Transport (公共交通费用收据) 、Other |