跳转到主要内容
Analytics Reporting Warehouse 存储的数据可用于分析系统中文档处理的效率。借助这些数据,您可以确定哪些文档在人工审核上耗时较长,以及造成这一情况的原因。 统计数据会针对包含至少一个人工审核步骤且至少包含一个文档技能的流程技能进行收集。系统会比较文档在人工审核前的初始状态与处理完成后的状态。 Analytics Reporting Warehouse 存储以下数据:
  • 关于文档更改的信息
  • 关于文档字段的信息:
    • 提取的字段值数量
    • 被更改的字段值数量
    • 每个字段的状态(指示其是正确的、存在识别问题、定位错误还是未被检测到)

从 v1 迁移到 v2

仅将路径从 “/v1/” 更改为 “/v2/”。请求/响应字段和行为均没有任何变化。

下载数据报表

注意: 只有具备 Tenant AdministratorProcessing Supervisor 角色的用户才能下载数据报表。有关更多信息,请参阅 基于角色的访问控制
要从 Analytics Reporting Warehouse 获取数据,请根据所需报表类型,向以下资源之一发送 GET 请求:

获取由流程技能处理的文档数据

获取由流程技能和文档技能处理的字段数据

请求正文包含以下参数:
  • startDate。需要下载数据的时间段的第一天(示例格式:2022-01-07T13:03:38,时间应为 UTC)。必填参数。
  • endDate。需要下载数据的时间段的最后一天(示例格式:2022-09-07T13:03:38,时间应为 UTC)。
  • processSkillId。要下载其数据的流程技能的 ID。必填参数。
  • documentSkillId。要下载其数据的文档技能的 ID。
注意: 此参数只能在 /api/reporting/v1/qa/process-skills/fields 请求中包含。
  • imageType。文档图像的类型。可能的取值:Unknown、Receipt、A4、BusinessCard、Book、Id、PassportRus、DiscountCard、BankCard、NotDocument、PassportPage。
  • imageColority。指示文档第一页是彩色、黑色还是黑白。可能的取值:BlackWhite、Gray、Color。
  • imageSource。文档图像的来源。可能的取值:Unknown、Photo、Scan、Synthetic、Screenshot、Pdf。
  • wasCorrectedInManualReview。指示文档字段是否在人工审核期间被修改。
  • wasDocumentTypeChangedInManualReview。指示文档类型是否在人工审核期间被更改。
生成的 CSV 文件将包含以下信息,并按列进行组织。

文档更改报表

ColumnDescription
ProcessSkillId流程技能的 ID。
ProcessSkillVersion流程技能的版本。
ProcessSkillName流程技能的名称。
DocumentSkillId文档技能的 ID。
DocumentSkillVersion文档技能的版本。
DocumentSkillName文档技能的名称。
TransactionId事务的 ID。
HasManualReview指示是否对文档进行了人工审核。可能的取值:1 或 0。
DocumentId传递进行处理的文档 ID。
DocumentName传递进行处理的文档名称。
PageSize文档第一页的尺寸(以像素为单位的宽度和高度)。
ImageColority指示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描、照片、PDF 文件、屏幕截图等。
ImageType文档第一页的图像类型。例如:A4、小票、银行卡等。
DPI文档第一页上的点数(或像素数)。
TransactionParameter1..N传递进行处理的事务参数。如果文档不包含任何事务参数,则报表中的值为 null。
DimensionField1..MValue传递进行处理的维度字段。如果文档不包含任何维度字段,则报表中的值为 null。
DocumentSkillChanged指示文档类型是否在人工审核期间被更改。可能的取值:true 或 false。
DocumentSkillIdUsedBeforeManualReview在进入人工审核阶段之前应用于该文档的文档技能。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中被人工更改的字段数量。
此报表的数据将保存 12 个月。

字段更改报告

ColumnDescription
ProcessSkillId流程技能的 ID。
ProcessSkillVersion流程技能的版本。
ProcessSkillName流程技能的名称。
DocumentSkillId文档技能的 ID。
DocumentSkillVersion文档技能的版本。
DocumentSkillName文档技能的名称。
TransactionId事务的 ID。
HasManualReview指示文档是否经过人工审核。可能的取值:1 或 0。
DocumentId提交进行处理的文档的 ID。
DocumentName提交进行处理的文档的名称。
PageSize文档第一页的像素尺寸(宽度和高度)。
ImageColority指示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描件、照片、PDF 文件、屏幕截图等。
ImageType文档第一页的图像类型。例如:A4、收据、银行卡等。
DPI文档第一页中的点(或像素)数量。
TransactionParameter1..N提交进行处理的事务参数。如果文档不包含任何事务参数,报告中的值将为 null。
DimensionField1..MValue提交进行处理的维度字段。如果文档不包含任何维度字段,报告中的值将为 null。
DocumentSkillChanged指示是否在人工审核期间更改了文档类型。可能的取值:true、false。
DocumentSkillIdUsedBeforeManualReview在人工审核阶段之前应用于文档的文档技能。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中被人工更改的字段数量。
FieldID文档字段的 ID。
FieldName文档字段的名称。
Correct关于非重复字段的纠正状态,以及未被纠正的重复字段实例数量的信息。可能的取值:
- 如果非重复字段在人工审核期间未被纠正,则为 1。
- 在人工审核期间未被纠正的重复字段实例数量。
RecognitionIssue关于在处理文档字段期间出现识别问题的信息。可能的取值:
- 如果非重复字段的值被纠正,但区域未被纠正,则为 1。
- 在人工审核期间其值被纠正的重复字段实例数量。
DetectedIncorrectly关于在人工审核期间所做更正的信息。可能的取值:
- 如果非重复字段的区域和值都被纠正,则为 1。
- 在人工审核期间区域和值都被纠正的重复字段实例数量。
NotDetected关于在人工审核前未被提取的字段值的信息。可能的取值:
- 如果非重复字段的值在人工审核前未被提取,并由审核员创建,则为 1。
- 在人工审核期间被创建的重复字段值实例数量。
IsInDocument指示该字段在文档中是否至少有一个实例。可能的取值:true、false。
此报告的数据将保存 14 天。 以 CSV 格式获取的数据可以在任何 BI 工具中进行进一步分析。