Saltar al contenido principal
Los FlexiLayouts y los clasificadores cuentan con varias configuraciones definidas por el usuario, incluidas opciones de prerreconocimiento como los idiomas de reconocimiento, el tipo de texto, los modos de prerreconocimiento y las áreas. Seleccionar la configuración de prerreconocimiento adecuada le ayudará a crear FlexiLayouts y clasificadores bien adaptados al procesamiento de sus documentos. Puede cambiar la configuración de prerreconocimiento en el cuadro de diálogo Propiedades de prerreconocimiento. Para abrir este cuadro de diálogo:
  • Haga clic en Properties… en el menú FlexiLayout o Classifier, o en el menú contextual del FlexiLayout o clasificador.
  • Haga clic en el botón Advanced Pre-recognition Properties… en la pestaña General del cuadro de diálogo Properties of %Name%.
Se abrirá el cuadro de diálogo Propiedades de prerreconocimiento. A continuación se enumeran las opciones disponibles en este cuadro de diálogo.

Pestaña General

Name

Método utilizado para imprimir el texto en los documentos:

  • Tipográfico,
  • Impresora matricial,
  • Máquina de escribir.

Determine el tipo de texto y evalúe su calidad antes de seleccionar estas opciones.

  • Modo rápido. Las imágenes en color y de medios tonos se binarizan antes del reconocimiento (se convierten en blanco y negro). El reconocimiento rápido requiere menos tiempo y ofrece resultados generalmente satisfactorios.
  • Modo equilibrado. El programa también tiene en cuenta los colores de la imagen; el reconocimiento es más lento, pero de mejor calidad.
    Nota. No se prevén más modificaciones en los algoritmos del modo de reconocimiento equilibrado, ya que se han alcanzado los mejores niveles posibles de velocidad y calidad
  • El modo normal es el predeterminado. También se recomienda cuando el prerreconocimiento en modo rápido / equilibrado da lugar a múltiples errores.
  • El modo preciso está pensado para extraer datos de imágenes digitales apenas legibles o de documentos de baja calidad
    Nota. El modo preciso es el que más tiempo requiere y, por tanto, se recomienda usarlo solo con imágenes o documentos problemáticos.

Idiomas de texto

Los idiomas utilizados en los documentos. Puede seleccionar uno o varios idiomas en la lista desplegable. Para consultar la lista completa de idiomas disponibles, consulte Idiomas de OCR compatibles con ABBYY FlexiLayout™ Studio.

Este grupo de opciones le permite agregar User dictionaries. Los diccionarios de usuario se utilizan para mejorar la calidad del reconocimiento al complementar los diccionarios predefinidos con vocabulario especializado, abreviaturas, nombres de empresas, etc.

Este grupo contiene dos opciones de procesamiento de códigos de barras:

  • Deshabilitar la extracción de códigos de barras – Seleccione esta opción si no deben detectarse códigos de barras en sus imágenes. Esto acelerará considerablemente el reconocimiento de documentos.
  • Extraer códigos de barras 2D: Data Matrix, Aztec, QR Code – Seleccione esta opción si las imágenes que necesita procesar contienen códigos de barras Data Matrix, Aztec y QR Code. Si esta opción no está activada, el programa no detectará estos códigos de barras en las imágenes y no estarán disponibles en las propiedades del elemento de código de barras.
  • Extraer códigos de barras postales - Seleccione esta opción si sus imágenes contienen códigos de barras postales, p. ej., Australia Post. Si esta opción no está seleccionada, no se detectarán códigos de barras postales en las imágenes y no estarán disponibles en las propiedades del elemento de código de barras.
    ¡Importante! La extracción de códigos de barras postales ralentiza el reconocimiento.

CJK

Contiene opciones para procesar idiomas CJK (chino, japonés y coreano).

  • Modo de furigana separada: seleccione esta opción para mejorar la calidad del reconocimiento al procesar texto japonés con furigana (ayudas para la pronunciación).

Extraer entidades nombradas: seleccione esta opción para extraer información relevante de un campo o grupo de campos mediante métodos de NLP.

Nota. Esta opción solo está disponible para las licencias que incluyen un módulo de NLP.

Extracción de texto vertical

Parámetros de extracción de texto vertical:

  • Extraer para todos los idiomas: detecta texto vertical en cualquiera de los idiomas compatibles.
  • No extraer: impide la detección de texto vertical.
  • Extraer para idiomas CJK: detecta texto vertical en chino, japonés o coreano.

El área que se debe prerreconocer. Puede especificar la posición del área de prerreconocimiento con respecto a los bordes de la página.

Esta opción le permite añadir un patrón de usuario en formato PTN o FBT. Recomendamos usar estos patrones de usuario si sus documentos contienen tipos de letra y caracteres no estándar.