Configure un script de clasificación de documentos en ABBYY FlexiCapture para combinar clasificadores, clasificación en cascada y asignar clases según la confianza.
Un clasificador de ABBYY FlexiCapture procesa los documentos enviados y determina su clase. Esto le permite elegir una Definición de Document que se usará para la extracción de campos.Cada clasificador corresponde a un lote de entrenamiento de clasificación específico.Si desea usar varios clasificadores para un solo lote, debe configurar un script de clasificación. Esto puede ser útil cuando hay documentos que deben someterse a una clasificación adicional. En este caso, el primer clasificador se usará para clasificar los documentos según su clase y, a continuación, se seleccionará un clasificador adicional desde el script en función de los resultados de la clasificación. Por ejemplo, los documentos pueden clasificarse primero en “facturas” y “contratos”, y luego las facturas pueden clasificarse más detalladamente según el nombre de la empresa.
Este script solo puede configurarse para un lote de entrenamiento de clasificación ya existente y no puede configurarse al crear un lote nuevo.
Para configurar un script de clasificación:
Abra Project → Project Properties…
Vaya a la pestaña Recognition en la ventana de propiedades del proyecto.
Abra el editor del script de clasificación haciendo clic en Set… a la derecha de Use script en la sección Classification.
En el cuadro de diálogo, seleccione un clasificador adecuado haciendo clic en Add… y eligiendo un lote de clasificación de la lista.
Ahora puede cambiar el Alias Name de un clasificador. Esto evita que tenga que reescribir un script si el nombre de un clasificador cambia durante el procesamiento. El script hará referencia al nombre específico indicado en la columna Alias Name.
Nivel de confianza de la clasificación. A diferencia de los clasificadores automáticos, cuando se trabaja con el script este parámetro debe especificarse manualmente en las propiedades de la página.
Script de ejemplo que asigna la clase Unknown a documentos cuya confianza de clasificación es inferior al valor especificado
El siguiente script puede usarse si, en su escenario, no es necesario asignar una clase a los documentos con un nivel de confianza bajo (aunque ya se les haya especificado una clase). Esos documentos deben clasificarse manualmente por un operador.¡Importante! Para que el script funcione, primero debe crearse una clase nueva; por ejemplo, “Unknown”. Después, debe vincularse a la Definición de Document en el cuadro de diálogo Class Mapping… Para obtener más información, consulte Asignación de clases a secciones de Definición de Document.
{ //FCTools.ShowMessage( c.Name + " -- " + c.Confidence.ToString() ); // registra el valor de confianza de la clasificación en el registro de eventos Page.Comment = Page.Comment + c.Name + "-" + c.Confidence.ToString() + "; "; // registra el valor de confianza de la clasificación en los comentarios de la página
}
if (classVars.Count>0)
{ if (classVars[0].Confidence<80) Page.IsResultClassConfident=false; // umbral de confianza por debajo del cual un documento se clasificará como clasificado con incertidumbre else Page.IsResultClassConfident=true;
if (classVars[0].Confidence<20) Page.ResultClassName="Unknown"; // umbral de confianza por debajo del cual se asignará a un documento la clase "Unknown" if (classVars.Count>1) {
int classesToShow = Math.Min(classVars.Count, 3); for(int i=0; i<classesToShow; i++)
Nota: Los valores del umbral de confianza de este script son solo para fines de demostración y el usuario puede modificarlos según el workflow concreto.