跳转到主要内容
Analytics Reporting Warehouse 会存储可用于分析系统中文档处理效率的数据。借助这些数据,您可以确定哪些文档需要更多的人工校验时间,以及原因。 对于至少包含一个人工校验步骤并且至少包含一个 Document skill 的 Process 技能,将收集统计信息。系统会比较文档在人工校验前的初始状态与处理后的状态。 Analytics Reporting Warehouse 存储以下数据:
  • 关于文档更改的信息
  • 关于文档 field 的信息:
    • 提取的字段值数量
    • 更改的字段值数量
    • 每个 field 的状态(指示其是否正确、是否存在识别问题、是否定位不正确或是否未被检测到)

下载数据报告

注意: 仅具有 Tenant AdministratorProcessing Supervisor 角色的用户可以下载数据报告。更多信息请参见 基于角色的访问控制(RBAC)
要从 Analytics Reporting Warehouse 获取数据,请根据所需报告的类型向以下任一资源发送 GET 请求:

获取由 Process 技能处理的文档相关数据

GET {base_url}/api/reporting/v1/qa/process-skills/documents

获取由 Process 和 Document skill 处理的字段数据

GET {base_url}/api/reporting/v1/qa/process-skills/fields
请求正文包含以下参数:
  • startDate。要下载数据的时间段的第一天(示例格式:2022-01-07T13:03:38,时间应为 UTC)。这是必填参数。
  • endDate。要下载数据的时间段的最后一天(示例格式:2022-09-07T13:03:38,时间应为 UTC)。
  • processSkillId。要下载其数据的 Process 技能的 ID。这是必填参数。
  • documentSkillId。要下载其数据的 Document skill 的 ID。
注意: 只能在 /api/reporting/v1/qa/process-skills/fields 请求中包含此参数。
  • imageType。文档图像的类型。可能的取值:Unknown、Receipt、A4、BusinessCard、Book、Id、PassportRus、DiscountCard、BankCard、NotDocument、PassportPage。
  • imageColority。指示文档第一页是彩色、灰度或黑白。可能的取值:BlackWhite、Gray、Color。
  • imageSource。文档图像的来源。可能的取值:Unknown、Photo、Scan、Synthetic、Screenshot、Pdf。
  • wasCorrectedInManualReview。指示文档 field 是否在人工校验期间被更正。
  • wasDocumentTypeChangedInManualReview。指示文档类型是否在人工校验期间被更改。
生成的 CSV 文件将在列中包含以下信息。

文档更改报告

说明
ProcessSkillIdProcess 技能的 ID。
ProcessSkillVersionProcess 技能的版本。
ProcessSkillNameProcess 技能的名称。
DocumentSkillIdDocument skill 的 ID。
DocumentSkillVersionDocument skill 的版本。
DocumentSkillNameDocument skill 的名称。
TransactionId处理事务的 ID。
HasManualReview指示文档是否经过人工校验。可取值:1 或 0。
DocumentId用于处理的文档 ID。
DocumentName用于处理的文档名称。
PageSize文档第一页的像素尺寸(宽度与高度)。
ImageColority指示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描、照片、PDF 文件、截图等。
ImageType文档第一页的图像类型。例如:A4、小票、银行卡等。
DPI文档第一页的每英寸点数(像素密度)。
TransactionParameter1..N传入处理的事务参数。若文档不包含任何事务参数,报告中的值为 null。
DimensionField1..MValue传入处理的维度 field。若文档不包含任何维度 field,报告中的值为 null。
DocumentSkillChanged指示在人工校验期间文档类型是否被更改。可取值:true、false。
DocumentSkillIdUsedBeforeManualReview在人工校验阶段之前应用于该文档的 Document skill。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中经人工更改的字段数量。
此报告的数据将保存 12 个月。

有关字段更改的报告

说明
ProcessSkillIdProcess 技能的 ID。
ProcessSkillVersionProcess 技能的版本。
ProcessSkillNameProcess 技能的名称。
DocumentSkillIdDocument skill 的 ID。
DocumentSkillVersionDocument skill 的版本。
DocumentSkillNameDocument skill 的名称。
TransactionId处理事务的 ID。
HasManualReview指示文档是否经过人工校验。可能的取值:1 或 0。
DocumentId提交处理的文档 ID。
DocumentName提交处理的文档名称。
PageSize文档第一页的像素尺寸(宽度和高度)。
ImageColority指示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描、照片、PDF 文件、屏幕截图等。
ImageType文档第一页的图像类型。例如:A4、小票、银行卡等。
DPI文档第一页的每英寸点数(像素密度)。
TransactionParameter1..N用于处理的事务参数。若文档不包含任何事务参数,则报告中的值为 null。
DimensionField1..MValue用于处理的维度 field。若文档不包含任何维度 field,则报告中的值为 null。
DocumentSkillChanged指示在人工校验期间文档类型是否发生更改。可能的取值:true、false。
DocumentSkillIdUsedBeforeManualReview进入人工校验阶段前应用于该文档的 Document skill。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中手动更改的字段数量。
FieldID文档字段的 ID。
FieldName文档字段的名称。
Correct关于非重复字段的更正状态以及未更正的重复字段实例数量的信息。可能的取值:
- 1:非重复字段在人工校验期间未被更正。
- 重复字段在人工校验期间未被更正的实例数量。
RecognitionIssue关于处理文档字段时的识别问题信息。可能的取值:
- 1:非重复字段的值被更正,但区域未被更正。
- 在人工校验期间更正了重复字段值的实例数量。
DetectedIncorrectly关于在人工校验期间所做更正的信息。可能的取值:
- 1:非重复字段的区域和值均被更正。
- 在人工校验期间更正了重复字段区域和值的实例数量。
NotDetected关于在人工校验前未被提取的字段值的信息。可能的取值:
- 1:非重复字段的值在人工校验前未被提取,且由校验员创建。
- 在人工校验期间创建的重复字段值的实例数量。
IsInDocument指示该字段在文档中是否至少存在一个实例。可能的取值:true、false。
该报告的数据将保存 14 天。 以 CSV 格式获取的数据可在任何 BI 工具中进一步分析。