Saltar al contenido principal
ABBYY FineReader Engine admite numerosos parámetros que le permiten ajustar con precisión el Engine. En la mayoría de los casos, no necesitará establecer todos los valores usted mismo: las propiedades de los objetos nuevos se configuran con valores predeterminados razonables al crearse y, para los principales escenarios de uso, proporcionamos perfiles predefinidos ampliamente probados. Si su caso de uso es más específico y ha determinado la configuración óptima para obtener la mejor velocidad y calidad de procesamiento, cree un perfil propio. Todos los parámetros de preprocesamiento de imágenes, análisis, reconocimiento, síntesis y exportación pueden modificarse mediante un perfil. Por ejemplo, si su aplicación exporta los resultados del reconocimiento a TXT (texto sin formato), muchas propiedades relacionadas con el diseño no son relevantes y pueden desactivarse. Después de cargar un perfil con ayuda de los métodos LoadPredefinedProfile/LoadProfile del objeto Engine, las propiedades de los objetos recién creados se establecerán con los valores predeterminados especificados en el perfil.

Perfiles predefinidos

ABBYY FineReader Engine proporciona un conjunto de perfiles predefinidos diseñados para los principales escenarios de uso. La mayoría de los perfiles están disponibles en dos variantes: optimizados para ofrecer la mejor calidad del documento resultante u optimizados para lograr la máxima velocidad de procesamiento. Para obtener la especificación completa de todos los perfiles predefinidos, consulte Especificación de perfiles predefinidos.

Adecuado paraextraer datosde un documento y presentarlos en un formato estructurado. Todos los objetos, incluidas tablas, imágenes, marcas de verificación y texto manuscrito, se guardan junto con su ubicación y atributos. Este perfil es ideal para el procesamiento posterior de los datos extraídos o para la integración con otras aplicaciones.

Adecuado paraconvertir documentosa un formato editable (por ejemplo, RTF, DOCX). La configuración está optimizada para mayor precisión:

  • Máxima calidad. Habilita la detección del estilo de fuente y la síntesis completa de la estructura lógica del documento.

Adecuado paraconvertir documentosa un formato editable (por ejemplo, RTF, DOCX). La configuración está optimizada para mayor velocidad de procesamiento:

  • Máxima calidad. Habilita la detección del estilo de fuente y la síntesis completa de la estructura lógica del documento.
  • La orientación de la imagen no se corrige.
  • El proceso de análisis del documento se acelera.

Adecuado para crear unarchivo electrónico(conversión a PDF, PDF/A, PDF y PDF/A con MRC). La configuración está optimizada para mayor precisión:

  • Permite detectar la mayor cantidad de texto posible en una imagen, incluido el texto incrustado en ella.
  • No se realiza la síntesis completa de la estructura lógica del documento.
Este perfil no está diseñado para convertir documentos a RTF, DOCX ni a PDF de solo texto. Para esos fines, utilice los perfiles de conversión de documentos.

Adecuado para crear unarchivo electrónico(conversión a PDF, PDF/A, PDF y PDF/A con MRC). La configuración está optimizada para mayor velocidad de procesamiento:

  • Permite detectar la mayor cantidad de texto posible en una imagen, incluido el texto incrustado en ella.
  • No se realiza la corrección de inclinación.
  • No se realiza la síntesis completa de la estructura lógica del documento.
  • Los procesos de análisis y reconocimiento del documento se aceleran.
Este perfil no está diseñado para convertir documentos a RTF, DOCX ni a PDF de solo texto. Para esos fines, utilice los perfiles de conversión de documentos.

Adecuado paraextraer textode un documento. La configuración está optimizada para mayor precisión:

  • Permite detectar todo el texto en una imagen, incluidas las áreas de texto pequeño de baja calidad (no se detectan imágenes ni tablas).
  • No se realiza la síntesis completa de la estructura lógica del documento.

El texto se extrae en el mismo orden en que lo leería una persona, lo que garantiza la coherencia de los datos al utilizarlos para el entrenamiento y el procesamiento con motores de procesamiento de lenguaje natural (NLP).

Este perfil no está diseñado para convertir documentos a RTF, DOCX ni a PDF de solo texto. Para esos fines, utilice los perfiles de conversión de documentos.

Adecuado paraextraer textode un documento. La configuración está optimizada para mayor velocidad de procesamiento:

  • Permite detectar todo el texto en una imagen, incluidas las áreas de texto pequeño de baja calidad (no se detectan imágenes ni tablas).
  • No se realiza la síntesis completa de la estructura lógica del documento.
  • Los procesos de análisis y reconocimiento del documento se aceleran.

El texto se extrae en el mismo orden en que lo leería una persona, lo que garantiza la coherencia de los datos al utilizarlos para el entrenamiento y el procesamiento con motores de procesamiento de lenguaje natural (NLP).

Este perfil no está diseñado para convertir documentos a RTF, DOCX ni a PDF de solo texto. Para ello, utilice los perfiles de conversión de documentos.

Adecuado parareconocer fragmentos de texto cortos. Actualmente, este perfil utiliza la configuración predeterminada.

Adecuado parala extracción de códigos de barras. Extrae únicamente códigos de barras (no se detectan textos, imágenes ni tablas). La configuración está optimizada para mayor precisión.

Por motivos de compatibilidad, también puede acceder a este perfil con el nombre BarcodeRecognition.

Este perfil requiere el móduloBarcode Autolocationdisponible en la licencia.

Adecuado parala extracción de códigos de barras. Extrae únicamente códigos de barras (no se detectan textos, imágenes ni tablas). La configuración está optimizada para mayor velocidad de procesamiento.

Este perfil requiere el móduloBarcode Autolocationdisponible en la licencia.

Adecuado para crear archivos PDF de alta compresión que contienen documentos completos guardados como imágenes. Se aplica la siguiente configuración:

  • No se realiza el reconocimiento del documento ni la síntesis de su estructura lógica.
  • No se realiza la corrección de inclinación.
  • La exportación a PDF está optimizada para minimizar el tamaño del archivo resultante.
  • El documento completo se guarda como imagen (modoPEM_ImageOnly).

Adecuado parareconocer tarjetas de visita. Se aplica la siguiente configuración:

  • Detecta únicamente tarjetas de visita.
  • Permite detectar todo el texto de una imagen, incluidas las áreas de texto pequeño de baja calidad (no se detectan imágenes ni tablas).
  • Se realiza la corrección de resolución.
  • No se realiza la síntesis completa de la estructura lógica del documento.

Adecuado paraextraer datos de una zona de lectura mecánica(MRZ). Se aplica la siguiente configuración:

  • Permite detectar y extraer todo el texto de una imagen (no se detectan imágenes, gráficos vectoriales ni tablas).
  • La corrección de resolución y geometría se realiza automáticamente.

Adecuado para reconocer dibujos técnicos. Tiene en cuenta el gran tamaño y la complejidad de los diagramas de ingeniería, así como la posibilidad de distintas orientaciones de texto dentro de la imagen. El perfil está diseñado para convertir dichas imágenes al formato PDF con capacidad de búsqueda. Se aplica la siguiente configuración:

  • Permite detectar todo el texto de una imagen, incluidos los bloques de texto con orientación vertical.
  • No se realiza la síntesis completa de la estructura lógica del documento.
Este perfil no está diseñado para convertir documentos a RTF, DOCX ni a PDF de solo texto. Para ello, utilice los perfiles de conversión de documentos.

Establece todos los parámetros de procesamiento en sus valores predeterminados.

La configuración incluida en estos perfiles puede cargarse mediante el método LoadPredefinedProfile del objeto Engine. Después de cargar el perfil, los objetos que se creen tendrán los nuevos valores predeterminados especificados en el perfil.
  • Los usuarios de FRE para Linux pueden encontrar los archivos de perfiles predefinidos en su paquete de distribución, en la carpeta Bin Libraries.
  • Los usuarios de FRE para macOS pueden encontrar los archivos de perfiles predefinidos en su paquete de distribución, en la carpeta /PredefinedProfiles.
  • Para determinar el conjunto de archivos de recursos necesarios para que su aplicación funcione con ayuda del archivo FREngineDistribution.csv, consulte la página correspondiente al escenario que haya elegido.

Perfiles de usuario

También puede crear un perfil de usuario personalizado. La sintaxis de un archivo de perfil es similar a la de los archivos *.ini. Puede añadir comentarios empezando una línea con un punto y coma. Las secciones contienen los nombres de los objetos entre corchetes, y las claves contienen las propiedades con sus nuevos valores. La sección especial llamada UserData puede contener cualquier clave definida por el usuario. Las propiedades de distintos tipos pueden escribirse en los siguientes formatos:
  • Los valores de las propiedades booleanas se representan mediante cadenas: true o false.
  • Los valores de las propiedades de enumeración se representan mediante nombres de constantes.
  • Los valores de las propiedades de cadena se escriben sin comillas.
Por ejemplo:
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; esto es un comentario
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
El método LoadProfile del objeto Engine permite cargar un archivo de perfil de usuario. Después de cargar el perfil de usuario, los objetos que se creen posteriormente tendrán las propiedades establecidas con los valores especificados en el perfil. Cargar parámetros desde un perfil es similar a establecer las propiedades correspondientes en el código del programa, pero simplifica la lógica de la aplicación. Si llama a LoadProfile con una cadena vacía como entrada, se usarán los valores predeterminados estándar. La corrección de los nuevos valores de las propiedades y su conformidad con la licencia se comprueban al crear el objeto correspondiente. Se puede usar un archivo de perfil para volver a definir todas las propiedades de los siguientes objetos: 1 Tenga en cuenta que la propiedad UserPatternsFile del objeto RecognizerParams solo admite la ruta completa del archivo de patrones, con el símbolo de barra correspondiente como separador. El valor de la ruta no debe ir entre comillas. En Windows, por ejemplo:
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
En Linux: /home/user/Documents/Patterns/ y en macOS: /Users/user/Documents/
2 Para establecer las propiedades de los objetos PictureExportParams o PaperSizeParams, especifique los parámetros directamente en la sección del objeto de parámetros de exportación (no en la sección PictureExportParams o PaperSizeParams). Esto le permitirá usar configuraciones diferentes para distintos formatos de exportación. Por ejemplo, para especificar el formato de imagen en escala de grises para archivos RTF:
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 Para establecer las propiedades del objeto DocumentContentInfoWritingParams, especifique los parámetros directamente en la sección de su objeto padre. Para el formato PDF, es el objeto PDFExportFeatures; para otros formatos, es el objeto de parámetros de exportación correspondiente. De este modo, puede especificar distintas opciones de información de contenido para diferentes formatos de exportación. Por ejemplo, si no desea incluir el autor del documento en los archivos PDF de salida, inserte las siguientes líneas en el perfil:
[PDFExportFeatures]
WriteAuthor = false
4 Para establecer las propiedades del objeto PageMargins, especifique los parámetros directamente en la sección de su objeto padre. Tenga en cuenta que la propiedad UseCustomPageMargins, establecida en TRUE, debe especificarse antes que los valores de los márgenes de página:
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000

Uso simultáneo de perfiles predefinidos y de usuario

Se pueden cargar simultáneamente un perfil predefinido y un perfil de usuario. El perfil de usuario tiene prioridad sobre el perfil predefinido; es decir, si el perfil de usuario establece el mismo parámetro que el perfil predefinido, se utilizará el valor del perfil de usuario. Si carga otro perfil predefinido, este nuevo perfil reemplaza al perfil predefinido anterior. Del mismo modo, un nuevo perfil de usuario reemplaza al perfil de usuario anterior. Tenga en cuenta que cargar un perfil limpia la sesión de reconocimiento actual (equivale a llamar al método IEngine::CleanRecognizerSession).

Consulte también

Parámetros de ajuste del preprocesamiento, el análisis, el reconocimiento y la síntesis Ajuste de los parámetros de exportación