跳转到主要内容
Analytics Reporting Warehouse 会存储可用于分析系统中文档处理效率的数据。借助这些数据,您可以识别出哪些文档在人工核验上花费了更多时间,以及原因。 系统会为包含至少一个 Manual Review 步骤且至少一个 Document skill 的 Process skills 收集统计数据。系统会将文档在人工审核前的初始状态与处理后的状态进行比较。 Analytics Reporting Warehouse 会存储以下数据:
  • 有关文档更改的信息
  • 有关文档字段的信息:
    • 提取的字段值数量
    • 被更改的字段值数量
    • 每个字段的状态(指示其是正确的、有识别问题、定位错误,还是未被检测到)

下载数据报告

注意: 只有拥有 Tenant AdministratorProcessing Supervisor 角色的用户才能下载数据报告。有关更多信息,请参阅 Role-Based Access Control
要从 Analytics Reporting Warehouse 获取数据,请根据所需报告的类型向以下任一资源发送 GET 请求:

获取由 Process 技能处理的文档数据

GET {base_url}/api/reporting/v2/qa/process-skills/documents

获取由 Process 和 Document 技能处理字段的相关数据

GET {base_url}/api/reporting/v2/qa/process-skills/fields
请求正文包含以下参数:
  • startDate。需要下载数据的时间段的第一天(示例格式:2022-01-07T13:03:38,时间应为 UTC)。此参数为必填。
  • endDate。需要下载数据的时间段的最后一天(示例格式:2022-09-07T13:03:38,时间应为 UTC)。
  • processSkillId。需要下载其数据的 Process skill 的 ID。此参数为必填。
  • documentSkillId。需要下载其数据的 Document skill 的 ID。
Note: 此参数只能在 /api/reporting/v1/qa/process-skills/fields 请求中使用。
  • imageType。文档图像的类型。可能的取值:Unknown、Receipt、A4、BusinessCard、Book、Id、PassportRus、DiscountCard、BankCard、NotDocument、PassportPage。
  • imageColority。指示文档首页是彩色、灰度还是黑白。可能的取值:BlackWhite、Gray、Color。
  • imageSource。文档图像的来源。可能的取值:Unknown、Photo、Scan、Synthetic、Screenshot、Pdf。
  • wasCorrectedInManualReview。指示文档字段是否在人工复核过程中被更正。
  • wasDocumentTypeChangedInManualReview。指示文档类型是否在人工复核过程中被更改。
生成的 CSV 文件将按列包含以下信息。

文档更改报告

说明
ProcessSkillIdProcess skill 的 ID。
ProcessSkillVersionProcess skill 的版本。
ProcessSkillNameProcess skill 的名称。
DocumentSkillIdDocument skill 的 ID。
DocumentSkillVersionDocument skill 的版本。
DocumentSkillNameDocument skill 的名称。
TransactionId事务 ID。
HasManualReview表示文档是否经过人工复核。可能的取值:1 或 0。
DocumentId传递进行处理的文档 ID。
DocumentName传递进行处理的文档名称。
PageSize文档第一页的尺寸(以像素为单位的宽度和高度)。
ImageColority表示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描件、照片、PDF 文件、屏幕截图等。
ImageType文档第一页的图像类型。例如:A4、收据、银行卡等。
DPI文档第一页的分辨率(每英寸点数/像素数)。
TransactionParameter1..N传递进行处理的事务参数。如果文档不包含任何事务参数,则报告中的值为 null。
DimensionField1..MValue传递进行处理的维度字段。如果文档不包含任何维度字段,则报告中的值为 null。
DocumentSkillChanged表示文档类型是否在人工复核期间发生了更改。可能的取值:true 或 false。
DocumentSkillIdUsedBeforeManualReview在 Manual Review 阶段之前应用于该文档的 Document skill。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中被人工修改的字段数量。
该报告的数据将保存 12 个月。

字段变更报告

ColumnDescription
ProcessSkillIdProcess skill 的 ID。
ProcessSkillVersionProcess skill 的版本。
ProcessSkillNameProcess skill 的名称。
DocumentSkillIdDocument skill 的 ID。
DocumentSkillVersionDocument skill 的版本。
DocumentSkillNameDocument skill 的名称。
TransactionId事务 ID。
HasManualReview表示文档是否经过人工复核。可能的取值:1 或 0。
DocumentId传入进行处理的文档 ID。
DocumentName传入进行处理的文档名称。
PageSize文档第一页的尺寸(像素,宽和高)。
ImageColority表示文档第一页是彩色、灰度还是黑白。
ImageSource文档第一页的图像来源。例如:扫描件、照片、PDF 文件、截图等。
ImageType文档第一页的图像类型。例如:A4、收据、银行卡等。
DPI文档第一页的每英寸点数(或像素数)。
TransactionParameter1..N传入进行处理的事务参数。如果文档不包含任何事务参数,则报告中的值为 null。
DimensionField1..MValue传入进行处理的维度字段。如果文档不包含任何维度字段,则报告中的值为 null。
DocumentSkillChanged表示在人工复核过程中文档类型是否被更改。可能的取值:true、false。
DocumentSkillIdUsedBeforeManualReview在 Manual Review 阶段之前应用于该文档的 Document skill。
NumberOfExportedFields文档中导出的字段数量。
NumberOfChangedFields文档中被人工更改的字段数量。
FieldID文档字段的 ID。
FieldName文档字段的名称。
Correct关于非重复字段的更正状态以及未被更正的重复字段实例数量的信息。可能的取值:
- 1:非重复字段在人工复核期间未被更正。
- 重复字段在人工复核期间未被更正的实例数量。
RecognitionIssue关于在处理文档字段时出现的识别问题的信息。可能的取值:
- 1:非重复字段的值被更正,但区域未被更正。
- 在人工复核期间,其值被更正的重复字段实例数量。
DetectedIncorrectly关于在人工复核期间所做更正的信息。可能的取值:
- 1:非重复字段的区域和值都被更正。
- 在人工复核期间区域和值都被更正的重复字段实例数量。
NotDetected关于在人工复核前未被提取的字段值的信息。可能的取值:
- 1:非重复字段的值在人工复核前未被提取,由核查员创建。
- 在人工复核期间被创建的重复字段值实例数量。
IsInDocument表示该字段在文档中是否至少有一个实例。可能的取值:true、false。
此报告数据将保留 14 天。 以 CSV 格式获取的数据可以在任何 BI 工具中进行进一步分析。