Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un documento estructurado tiene un diseño fijo: los campos aparecen en el mismo lugar en cada instancia. Algunos ejemplos habituales son los cuestionarios, los formularios de solicitud y las declaraciones de impuestos. Algunos documentos estructurados tienen un número reducido de variantes con pequeñas diferencias en la posición de los campos. Para obtener más contexto, consulte Extraer datos de documentos en Advanced Designer.
Form 1040 del IRS (2020): ejemplo de documento estructurado

Dónde crear el skill

Puede crear skills para documentos estructurados en Skill Designer o en Advanced Designer; solo puede editarlos en Advanced Designer.
  • Skill Designer (en la nube) — active el conmutador Fixed-form documents en el skill y luego cargue y etiquete algunos formularios en blanco. Consulte Configurar un Skill de documento para procesar documentos estructurados. El skill resultante incluye una actividad Forms, visible si más adelante lo abre en Advanced Designer.
  • Advanced Designer (escritorio de Windows) — úselo cuando necesite combinar la actividad Forms con otras actividades de Vantage (los escenarios que se indican a continuación).
Si no habilita el conmutador Fixed-form documents en Skill Designer, el flujo de procesamiento del skill solo contiene una actividad Fast Learning.
Una vez que el flujo de un skill incluye una actividad Forms junto con otras actividades, o contiene varias actividades Forms, solo puede cambiar las propiedades del skill desde Vantage; el entrenamiento y las modificaciones más profundas deben realizarse en Advanced Designer.

Elija un escenario

EscenarioCuándo usarloActividades clave
Formularios con elementos no estructuradosLos formularios también pueden incluir códigos de barras, sellos o tablas de longitud variableForms + Extraction Rules
Formularios mixtos y documentos no estructuradosLos mismos datos se reciben como formularios o como texto libreClassify + IF + Forms + Fast Learning

Formularios con elementos no estructurados

Algunos documentos estructurados incluyen elementos no estructurados, como códigos de barras o sellos colocados en cualquier parte de la página, o tienen tablas de longitud variable además de un diseño fijo. Para procesarlos, combine una actividad Forms con una actividad Extraction Rules: Forms se encarga de los campos estructurados y Extraction Rules, de los elementos no estructurados (por ejemplo, códigos de barras).
1

Crear una Skill de documento

Abra Advanced Designer y haga clic en Create Document Skill en la página de inicio.
2

Agregar y entrenar una actividad Forms

En la pestaña Activities, agregue una actividad Forms. En el Activity Editor, en la pestaña Blank Form, cargue un formulario en blanco de ejemplo por variante (se recomienda un máximo de diez variantes) y etiquete los campos que desea extraer. Consulte las directrices de etiquetado. Haga clic en Train Activity.
3

Probar la actividad Forms

Abra la pestaña Test Set, cargue los documentos de prueba completados, verifique que los campos estén etiquetados correctamente y haga clic en Test Activity. Revise los resultados.
4

Agregar y configurar una actividad Extraction Rules

De vuelta en la pestaña Activities, agregue una actividad Extraction Rules y configúrela en el Activity Editor.
5

Probar y publicar

Haga clic en Test Skill Using Selected Documents. Si los resultados son aceptables, publique la skill. De lo contrario, ajuste el etiquetado, vuelva a entrenar y pruebe de nuevo.
Tablas y grupos repetidos. Las actividades Forms pueden extraer tablas y grupos repetidos solo cuando se conoce de antemano el número máximo de filas o de instancias y los límites son fijos. Etiquete cada fila que pueda aparecer en todas las variantes del formulario: en los resultados, solo se devuelven las filas con datos. Actualmente, las tablas de Forms solo admiten valores de texto; para columnas que contengan casillas de verificación o códigos de barras, use un grupo repetido en su lugar. Si el número de filas no se conoce de antemano, use otra tecnología de Vantage.

Formularios mixtos y documentos no estructurados

Algunos flujos de trabajo reciben la misma información en un formulario impreso o en un documento de formato libre; por ejemplo, cuestionarios devueltos tanto como formularios completados como en texto no estructurado. Combine una actividad Forms con una actividad Fast Learning (o Extraction Rules) y dirija los documentos por la ruta correcta con una Actividad Classify y una actividad IF.
1

Crear un Skill de documento

Abra Advanced Designer y haga clic en Create Document Skill en la página de inicio.
2

Agregar y entrenar una actividad Forms

En la pestaña Activities, agregue una actividad Forms. En Activity Editor, en la pestaña Blank Form, cargue un formulario en blanco de ejemplo y etiquete sus campos. Consulte las directrices de etiquetado. Haga clic en Train Activity.
3

Probar la actividad Forms

Abra la pestaña Test Set, cargue documentos de prueba completados, verifique el etiquetado de los campos y haga clic en Test Activity. Revise los resultados.
4

Agregar y entrenar una actividad Fast Learning

En la pestaña Activities, agregue una actividad Fast Learning y configúrela y entrénela en Activity Editor.
5

Agregar una Actividad Classify al inicio

Agregue una Actividad Classify (Classify By Company o Classify By Text and Image) al principio del flujo. En Activity Editor, cree una clase para cada variante de documento, asigne clases a sus documentos de entrenamiento y entrene la actividad.
6

Ramificar el flujo con una actividad IF

Agregue una actividad IF y, a continuación, conecte sus ramas a las actividades Forms y Fast Learning para que cada tipo de documento siga la ruta de extracción correcta.
7

Probar y publicar

Haga clic en Test Skill Using Selected Documents. Si los resultados son aceptables, publique el skill. De lo contrario, ajuste el etiquetado y vuelva a entrenarlo.

actividad Forms

Extraer campos de documentos con diseños fijos.

actividad Extraction Rules

Definir la extracción basada en reglas para elementos no estructurados, como códigos de barras.

actividad Fast Learning

Perfeccionar la extracción en documentos no estructurados mediante comentarios de la revisión manual.

actividades Classify

Ramificar un flujo según la variante del documento antes de la extracción.