Formularios fijos estructurados;
Formularios fijos estructurados;
Los formularios estructurados son documentos que contienen un conjunto de campos de información marcados cuyo formato, número y diseño no cambian de una instancia del documento a otra. Estos documentos se denominan formularios fijos. Por ejemplo, la mayoría de los cuestionarios y formularios de solicitud son formularios fijos. Estos formularios suelen distribuirse como formularios en blanco y rellenarse a mano.Para identificar un formulario fijo en un flujo de documentos y extraer datos de él, debe crear un único diseño fijo que indique al programa la ubicación de los campos que contienen los datos que se van a extraer.Los formularios fijos creados para cumplir los requisitos de entrada automática pueden procesarse de la forma más eficaz. Estos formularios se denominan formularios legibles por máquina. Para obtener más información sobre los requisitos de estos formularios y los métodos para crearlos, consulte la sección Creación de formularios legibles por máquina.El programa incluye una práctica herramienta para diseñar formularios legibles por máquina: ABBYY FormDesigner (suministrada junto con ABBYY FlexiCapture). Puede consultar información sobre el diseño de formularios con ABBYY FormDesigner en la Guía del usuario y en los temas de ayuda.Las etapas básicas para crear una Definición de Document se describen específicamente para documentos estructurados.Nota: Los formularios fijos recibidos por fax pueden estar distorsionados: su tamaño y la posición relativa de sus campos pueden verse alterados. Por ello, recomendamos usar un FlexiLayout para aumentar la calidad de reconocimiento al procesar estos formularios.
Formularios y documentos flexibles semiestructurados;
Formularios y documentos flexibles semiestructurados;
Se trata de documentos que contienen un conjunto de campos de información cuyo diseño, número y disposición pueden variar significativamente en distintas instancias del documento. Estos documentos se denominan flexibles. Por ejemplo, las cuentas son documentos semiestructurados, ya que a menudo varían tanto en el número de elementos como en su formato porque proceden de distintas empresas. Todas las cuentas tienen un número de cuenta y un monto pendiente de pago, pero estos datos se encuentran en lugares diferentes.Para identificar formularios flexibles y extraer datos de ellos, ABBYY FlexiCapture usa un diseño flexible (FlexiLayout). Un diseño flexible se crea con la ayuda de un módulo especial llamado ABBYY FlexiLayout Studio. Los detalles de este módulo están disponibles en la Guía del usuario y en los temas de ayuda.El procesamiento de documentos semiestructurados difiere del procesamiento de formularios fijos solo en la etapa de creación y carga de un diseño. Para obtener más información, consulte Creación de una Definición de Document para el procesamiento de documentos semiestructurados.
Documentos no estructurados con diseño de estilo libre.
Documentos no estructurados con diseño de estilo libre.
ABBYY FlexiCapture se puede usar para procesar documentos no estructurados que contienen información presentada en estilo libre, por ejemplo, contratos, cartas, pedidos y gráficos. El programa puede identificar automáticamente documentos no estructurados como anexos de formularios fijos o flexibles, o puede identificarlos con la ayuda de un diseño flexible y luego exportarlos como archivos PDF con capacidad de búsquedaarchivos PDF con capacidad de búsqueda o como archivos gráficos. Puede extraer campos de índice de documentos no estructurados tanto automáticamente con la ayuda de un diseño flexible como mediante entrada manual.Se puede usar NLP para procesar documentos no estructurados. Esta tecnología utiliza modelos de NLP para extraer información del texto.Un escenario típico para el procesamiento de documentos no estructurados es cuando un archivo en papel debe convertirse a formato electrónico y es necesario extraer dos o tres campos de índice para organizar una búsqueda rápida basada en atributos.Para obtener más información, consulte Creación de Definiciones de Document para documentos no estructurados y semiestructurados.
