Parámetros de prerreconocimiento

Los FlexiLayouts y los clasificadores cuentan con varias configuraciones definidas por el usuario, incluidas opciones de prerreconocimiento como los idiomas de reconocimiento, el tipo de texto, los modos de prerreconocimiento y las áreas. Seleccionar la configuración de prerreconocimiento adecuada le ayudará a crear FlexiLayouts y clasificadores bien adaptados al procesamiento de sus documentos. Puede cambiar la configuración de prerreconocimiento en el cuadro de diálogo Propiedades de prerreconocimiento. Para abrir este cuadro de diálogo, use una de las siguientes formas:

Haga clic en Properties… en el menú FlexiLayout o Classifier, o en el menú contextual del FlexiLayout o clasificador.
Haga clic en el botón Advanced Pre-recognition Properties… en la pestaña General del cuadro de diálogo de propiedades del FlexiLayout o clasificador.

Las siguientes opciones están disponibles en el cuadro de diálogo Propiedades de prerreconocimiento.

Pestaña General

Nombre – El método utilizado para imprimir el texto en los documentos. Determine el tipo de texto y evalúe su calidad; luego, seleccione una de las siguientes opciones:

Tipográfico
Impresora matricial
Máquina de escribir

Modo de prerreconocimiento – El modo utilizado para el prerreconocimiento de los documentos.

Modo	Descripción
Rápido	Las imágenes en color y de semitonos se binarizan antes del reconocimiento (se convierten a blanco y negro). El reconocimiento rápido requiere menos tiempo y proporciona resultados generalmente satisfactorios.
Equilibrado	También se tienen en cuenta los colores de la imagen, por lo que el reconocimiento es más lento, pero de mejor calidad. No se prevén más modificaciones en los algoritmos del modo Equilibrado, ya que se ha alcanzado la mejor combinación posible de velocidad y calidad.
Normal	El modo predeterminado. También se recomienda cuando el prerreconocimiento en modo Rápido o Equilibrado produce varios errores.
Preciso	Está pensado para extraer datos de imágenes digitales apenas legibles o documentos de baja calidad. Este modo requiere más tiempo, así que úselo solo con imágenes o documentos problemáticos.

Pestaña Idiomas

Idiomas de texto – Los idiomas utilizados en los documentos. Puede seleccionar uno o varios idiomas en la lista desplegable. Para consultar la lista completa de idiomas disponibles, consulte Idiomas de OCR compatibles con ABBYY FlexiLayout™ Studio. User dictionaries – Este grupo de opciones le permite agregar User dictionaries. Los User Dictionaries mejoran la calidad del reconocimiento al complementar los diccionarios predefinidos con vocabulario especializado, abreviaturas, nombres de empresas, etc.

Pestaña Advanced

Códigos de barras

Opción	Descripción
Deshabilitar la extracción de códigos de barras	Seleccione esta opción si no desea que se detecten códigos de barras en sus imágenes. Esto acelera considerablemente el reconocimiento de documentos.
Extraer códigos de barras 2D: Data Matrix, Aztec, QR Code	Seleccione esta opción si las imágenes que procesa contienen códigos de barras Data Matrix, Aztec y QR Code. Si esta opción no está habilitada, estos códigos de barras no se detectarán en las imágenes ni estarán disponibles en las propiedades del elemento código de barras.
Extraer códigos de barras postales	Seleccione esta opción si sus imágenes contienen códigos de barras postales, por ejemplo, Australia Post. Si esta opción no está seleccionada, los códigos de barras postales no se detectarán en las imágenes ni estarán disponibles en las propiedades del elemento código de barras. La extracción de códigos de barras postales ralentiza el reconocimiento.

CJK

Contiene opciones para procesar idiomas CJK (chino, japonés y coreano). Modo furigana separado – Seleccione esta opción para mejorar la calidad del reconocimiento al procesar texto japonés con furigana (ayudas de pronunciación).

Reconocimiento de NER

Extraer Named Entities (NER) – Seleccione esta opción para extraer información relevante de un campo o grupo de campos mediante métodos de NLP.

Esta opción solo está disponible para las licencias que incluyen un módulo de NLP.

Extracción de texto vertical

Opción	Descripción
Extraer para todos los idiomas	Detecta texto orientado verticalmente escrito en cualquiera de los idiomas compatibles.
No extraer	Impide la detección de texto orientado verticalmente.
Extraer para idiomas CJK	Detecta texto vertical escrito en chino, japonés o coreano.

Área de prerreconocimiento

El área que se va a prerreconocer. Puede especificar la posición del área de prerreconocimiento en relación con los bordes de la página.

Patrón de usuario

Agrega un patrón de usuario en formato PTN o FBT. Use un patrón de usuario si sus documentos contienen fuentes y caracteres no estándar.

Prerreconocimiento

Ejecutar el prerreconocimiento y ver los resultados

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Parámetros de prerreconocimiento

Pestaña General

Pestaña Idiomas

Pestaña Advanced

Códigos de barras

CJK

Reconocimiento de NER

Extracción de texto vertical

Área de prerreconocimiento

Patrón de usuario

​Pestaña General

​Pestaña Idiomas

​Pestaña Advanced

​Códigos de barras

​CJK

​Reconocimiento de NER

​Extracción de texto vertical

​Área de prerreconocimiento

​Patrón de usuario

Pestaña General

Pestaña Idiomas

Pestaña Advanced

Códigos de barras

CJK

Reconocimiento de NER

Extracción de texto vertical

Área de prerreconocimiento

Patrón de usuario