Saltar al contenido principal
La pestaña Results del Document Skill Designer contiene estadísticas de extracción de campos para los Skills de documento. Use estas estadísticas para comprender cómo mejorar la calidad de la extracción. Todos los campos extraídos por el skill aparecen en la columna Fields. Los campos que pertenecen a un grupo se agrupan en un desplegable contraído con el nombre del grupo.
Pestaña Results que muestra estadísticas de extracción por campo
Están disponibles las siguientes estadísticas de extracción de campos:
  • Accuracy — Porcentaje de campos con valores extraídos correctamente, tanto por campo como en el conjunto de todos los campos (la fila ALL FIELDS). La exactitud por campo se calcula de la siguiente manera:
    Accuracy = Correct / (Correct + Recognition Issue + Located Incorrectly + Not Detected)
    
    La fila ALL FIELDS usa la misma fórmula, con cada término agregado para todos los campos.
  • Correct — Número de instancias de campo cuyo valor extraído coincide con el valor de referencia.
  • Recognition Issue — Número de instancias de campo detectadas en el documento, pero no reconocidas correctamente.
  • Located Incorrectly — Número de instancias de campo cuyos valores difieren de los valores previstos porque sus regiones se detectaron en ubicaciones distintas de las definidas en el etiquetado.
  • Not Detected — Número de instancias de campo no detectadas.
  • Frequency in Documents — Porcentaje de documentos que contienen el campo en cuestión.
De forma predeterminada, se muestran estadísticas de todos los campos. Para filtrar, haga clic en el icono de filtro de la parte superior de la columna Fields y seleccione los campos que desea ver.
Para un análisis de calidad más detallado — Precision, Recall y F-measure, tanto para los valores de los campos como para la detección de regiones — edite su skill en Advanced Designer. Consulte Advanced Accuracy Reports para obtener más información.
Para que estas estadísticas reflejen la calidad en producción, la distribución de documentos de su conjunto de prueba debe coincidir con la que ve en producción; por ejemplo, si el 30 % de sus facturas en producción provienen de un proveedor concreto, aproximadamente el 30 % del conjunto de prueba también debería provenir de ese proveedor. El uso de un conjunto ciego (documentos no utilizados para entrenamiento ni pruebas anteriores) refuerza aún más la validez de los resultados.

Revisión de campos extraídos con errores

Para ver los documentos que contienen campos extraídos con errores, haga clic en el valor de la columna Recognition Issue, Located Incorrectly o Not Detected correspondiente al campo que está investigando.
Al hacer clic en el valor de la columna Recognition Issue para el campo Order Date, se abre una pestaña que muestra solo los documentos en los que el campo Order Date presenta un problema de reconocimiento.

Ver los modos de extracción

La pestaña Result Review le permite revisar los resultados de la extracción, los errores de etiquetado y los problemas de reconocimiento, así como comparar el etiquetado realizado durante la configuración con el que produjo el entrenamiento. Los documentos pueden verse en tres modos:
  • Reference — Muestra el etiquetado de referencia creado al configurar la skill (antes del entrenamiento) y los valores de campo extraídos con él. En este modo, se pueden editar los valores de campo y las regiones.
  • Predicted — Muestra los valores de campo y las regiones obtenidos al procesar los documentos. No se puede editar.
  • Difference — Muestra las diferencias entre el etiquetado de referencia y el predicho. Los valores y las regiones idénticos aparecen en verde; los diferentes, en rojo. No se puede editar.
Modo Difference de la Skill de documento con valores idénticos en verde y valores diferentes en rojo
Cambie de modo haciendo clic en la pestaña correspondiente de la barra de herramientas.

Corregir el etiquetado de referencia

Si un campo se etiquetó de forma incorrecta durante la configuración, pero se procesó correctamente durante el entrenamiento, puede actualizar el etiquetado de referencia. Cambie al modo Difference y haga clic en el icono situado encima del valor del campo mal etiquetado:
Icono de problemas de reconocimiento encima del valor de un campo etiquetado
El cuadro Campo en referencia muestra el valor extraído mediante el etiquetado de referencia. Haga clic en Copiar de Predicted para sustituir el valor incorrecto por el valor extraído durante el procesamiento.
Un problema de reconocimiento significa que uno o más caracteres no se reconocieron correctamente. Para corregirlo, ajuste las propiedades del campo para que esos caracteres se interpreten correctamente; por ejemplo, si un campo contiene solo números, establezca su tipo de datos en Número. Esto evitará, por ejemplo, que el número “1” se reconozca como “l” (ele minúscula) o “I” (i mayúscula).
Si el cuadro Campo en referencia contiene el valor correcto pero el resultado del procesamiento es incorrecto, aumente el número de documentos del conjunto y vuelva a entrenar el skill. Para ir al siguiente documento con el mismo error en el mismo campo, haga clic en Ir al siguiente documento en el panel Acciones.

Añadir campos

Marque campos en la pestaña Editor y configure las propiedades de los campos según el tipo.

Verificación de reglas

Utilice reglas para validar, modificar o calcular los valores de los campos extraídos en una Skill de documento.

Etiquetado de documentos

Directrices para etiquetar documentos estructurados y semiestructurados durante el entrenamiento.

Entrenamiento y pruebas de una Skill de documento

Guía de Advanced Designer para entrenar, probar y medir la calidad de una Skill de documento.