Versión 7
Correcciones de seguridad
Perfiles predefinidos
Apertura y preprocesamiento de imágenes
- Para acelerar la preparación de imágenes, puede establecer el tipo de documento (IPrepareImageMode::DocumentType) si se conoce, para que no sea necesario ejecutar el clasificador de documentos.
- Nuevos formatos de entrada: HEIF, SVG, WebP.
- Tipo de documento para planos técnicos con muchos fragmentos de texto en distintas direcciones (DocumentTypeEnum::DT_TechnicalDrawing).
Exportación
- Los datos extraídos del documento ahora se pueden exportar en formato JSON (JsonExportParams).
Mejoras de OCR e ICR
- Ahora se pueden detectar marcas de selección durante el análisis de layout (IPageAnalysisParams::DetectCheckmarks)
- Modo de análisis especial para documentos con layout complejo y tablas (IPageAnalysisParams::AnalysisMode)
- Una nueva configuración permite guardar sellos como imágenes (IPageAnalysisParams::DetectStamps)
- Además del texto en letra de imprenta, ahora también se reconoce el texto manuscrito en inglés, español, francés, alemán y japonés (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- Una nueva propiedad de tipo probabilidad que estima la precisión del reconocimiento de caracteres (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Ejemplos de código para Windows
- Nuevo ejemplo de HelloBCR para .NET Core
- Nuevo ejemplo de DataExtraction para .NET Core
Versión 5
Nuevo y mejorado reconocimiento de idiomas
- Reconocimiento del idioma bangla
- Reconocimiento del idioma especial Arabic_Amount en Windows
Mejoras de OCR e ICR
- La síntesis de tarjetas de presentación ahora puede realizarse con parámetros adicionales (IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- Ahora puede usar el nuevo modo de reconocimiento Accurate (IRecognizerParams::Mode)
- Nueva propiedad para comprobar la presencia de códigos de barras, excepto los postales (IBarcodeParams::EnableBarcodesCheck)
- Ahora puede detectar el tipo de código de barras, excluyendo los postales, con la constante BT_AutodetectWithoutPostal (BarcodeTypeEnum)
- ABBYY FineReader Engine ahora reconoce los códigos postales japoneses para clientes (BarcodeTypeEnum, tipo de código de barras)
Apertura y preprocesamiento de imágenes
- Ahora puede cargar los documentos guardados con versiones de ABBYY FineReader Engine compatibles anteriormente (IFRDocument::ConvertFromOldVersion)
- Puede obtener información sobre la presencia de una firma digital en un documento (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- Ahora se puede comprobar la fiabilidad de la capa de texto (IFRDocument::CheckTextLayer)
- Se ha mejorado el modo predeterminado para procesar archivos PDF creados digitalmente (SourceContentReuseModeEnum::CRM_Auto)
- Ahora se puede cambiar la apariencia del archivo PDF de salida (ITextLayerInjectionParams::AllowChangePDFAView)
- Ahora puede identificar y abrir archivos de tipo PDF Portfolio (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
Exportación
- La exportación a ALTO ahora admite las versiones 4.0, 4.1 y 4.2 de ALTO (AltoVersionEnum)
- Nuevos modos de incrustación de fuentes en los archivos PDF de salida (FontEmbeddingModeEnum)
- Nuevas interfaces para añadir imágenes definidas por el usuario a los PDF de salida (IPDFPictures, IPDFPicture)
- Los formatos XLS y XPS ya están disponibles para exportar documentos (XLExportParams, XPSExportParams) en Linux y macOS
Ejemplos de código
- Nuevo ejemplo Hello para .NET Core
Otras mejoras
- Puede obtener información sobre el tamaño de memoria asignado al objeto de documento (IFRDocument::AllocatedSize)
- Nuevas opciones para liberar una licencia en línea (IEngine::ReleaseOnlineLicense, “Liberar licencias en línea…” en la utilidad License Manager) en Linux y Windows
- El instalador de ABBYY FineReader Engine para Windows ahora utiliza Windows Installer XML Toolset (WiX)
- Nueva opción LICENSEDATADIR para cambiar la carpeta utilizada para almacenar la información auxiliar (Installing the ABBYY FineReader Engine Library in Automatic Mode) en Windows
- ABBYY FineReader Engine 12 ahora puede ejecutarse en Azure Services en Windows
- Ahora también puede obtener la fecha de renovación de las limitaciones de la licencia en cuanto al número de páginas procesadas (ILicense::VolumeRefreshingDate)
- Nueva subsección que describe cómo ejecutar Licensing Service como usuario no root (Installing the Licensing Service) en Linux
Versión 4
Características especiales
- Puede comparar dos documentos o dos páginas (IComparator::CompareDocuments, IComparator::ComparePages)
- Los métodos de la API de comparación de documentos ayudan a detectar cambios en el texto (IChange::GetAsTextChange) y a exportar el resultado de la comparación en formato XML o DOCX (IComparisonResult::Export)
- Puede migrar el código que usa ABBYY ScanDifFinder SDK a la API de comparación de documentos implementada en ABBYY FineReader Engine (Guía de migración de ScanDifFinder SDK a la API de comparación de documentos) en Windows
Mejoras en OCR e ICR
- Nuevos códigos de barras postales admitidos: KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, Tipos de códigos de barras)
Apertura y preprocesamiento de imágenes
- El layout del documento se puede guardar en un flujo y leerse desde él (ILayout::SaveToStream, IEngine::CreateLayoutFromStream) o guardarse como una matriz de bytes (ILayout::SaveToArray)
Exportación
- La exportación a PDF permite configurar la orientación de la página (IPDFExportFeatures::PageOrientation)
- La exportación a RTF permite ajustar los márgenes de la página (IRTFExportParams::PageMargins) y aumentar el tamaño de la página si el contenido no cabe en ella (IRTFExportParams::IncreasePaperSizeToFitContent)
- La exportación a XLSX permite incrustar imágenes en el documento de salida (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
Ejemplos de código
- Nueva herramienta de demostración de Windows Document Comparison y nuevo ejemplo de Document Comparison. Muestran cómo puede comparar un documento o una página con otro.
- Ejemplo CommandLineInterface actualizado para Linux y Windows.
- Nuevo ejemplo CommandLineInterface para macOS. Este ejemplo ofrece la interfaz de línea de comandos de ABBYY FineReader Engine
- Nuevo ejemplo SAFEARRAY_Hello para macOS. Este ejemplo muestra el procesamiento de documentos mediante el uso del tipo SAFEARRAY
Otras mejoras
Linux y Windows
- Una licencia en línea limita el número de núcleos de CPU disponibles para una estación de trabajo.
- Una licencia en línea ahora requiere el uso de GoDaddy Trusted Root Certification Authority en el equipo donde está instalado Licensing Service.
- Se ha actualizado la lista de parámetros para la instalación silenciosa en Linux.
Versión 3
Funcionalidades especiales
Extracción de MRZ:- Ahora es posible extraer la MRZ de las imágenes de los documentos (IFRPage::ExtractMrz)
- Los datos extraídos de la MRZ contienen campos y líneas (MrzField, MrzData, MrzLine) con información sobre el documento y su titular, y pueden exportarse a un archivo XML o a un archivo JSON
Novedades y mejoras en el reconocimiento de idiomas
- Reconocimiento del georgiano
- Reconocimiento de fórmulas matemáticas
Apertura y preprocesamiento de imágenes
- Ahora puede abrir documentos generados digitalmente con los mismos métodos que se usan para abrir imágenes en Linux y Windows; los documentos digitales se convertirán y se cargará su contenido (OfficeConversionSettings, OfficeConverters)
- Puede establecer el umbral de binarización durante el preprocesamiento de la imagen (IPrepareImageMode::BinarizationThreshold)
- El modo de trabajo con las páginas del documento en memoria puede establecerse antes de convertir las imágenes de entrada (IBatchProcessor::PageFlushingPolicy) en Linux y Windows
Exportación
- Ahora se pueden consultar y modificar las fechas de creación y de modificación. Además, puede configurar el modo en que se escriben estas fechas en el documento de salida (DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). Solo se pueden escribir en el documento fechas con un formato válido. Si se produce un error durante la exportación, especifique la fecha con un formato válido o cambie su modo de escritura y vuelva a llamar al método de exportación (Handling Errors During PDF/XPS Export)
- Formato horario original en el documento de salida (TimeZoneTypeEnum)
Ejemplos de código
- Nuevo ejemplo MRZExtraction para Linux y Windows. Este ejemplo muestra cómo extraer datos de una zona de lectura mecánica (MRZ)
- Nuevo ejemplo de código para Windows que ilustra cómo implementar un temporizador que abortará el procesamiento si una llamada a un método tarda demasiado
- Nuevo ejemplo ICR para Linux, que muestra cómo reconocer texto manuscrito en letra de imprenta a partir de la imagen del documento
Otras mejoras
- Los bloques de datos ahora pueden ordenarse según su posición (ILayout::SortedBlocks)
- El archivo del Acuerdo de licencia de usuario final ahora está disponible en ABBYY FineReader Engine Distribution Kit
Linux y Windows
- Amazon Linux AMI ahora es compatible con ABBYY FineReader Engine for Linux
- Una licencia en línea no requiere ninguna configuración específica, pero debe establecer sus parámetros si desea usar la licencia con el servidor proxy
- Ahora se permite una licencia en línea para un número limitado de conexiones, que puede modificarse una vez finalizado el tiempo de ejecución autónoma de la licencia
- ABBYY FineReader Engine 12 ahora puede ejecutarse dentro de un contenedor Docker
- La lista de Java Development Kits compatibles se encuentra en Requisitos del sistema
- El número de compilación de ABBYY FineReader Engine ahora está disponible antes de que se carguen sus módulos. Puede encontrarlo en el nombre del archivo JAR incluido en ABBYY FineReader Engine Distribution Kit
Versión 2
Características destacadas
Se ha mejorado la API de clasificación:- Las tecnologías de clasificación actualizadas permiten clasificar en función de las características de la imagen, de las características del texto reconocido o de una combinación de ambas (ClassifierTypeEnum)
- La clasificación ahora está disponible tanto para documentos como para páginas (IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- Los nuevos modelos de clasificación pueden entrenarse mediante la técnica de validación cruzada de k particiones (ValidationParams), con información detallada sobre el rendimiento del modelo (ValidationResult)
Novedades y mejoras en el reconocimiento de idiomas
- Reconocimiento del birmano
- Japonés (moderno) mejorado para mejorar el reconocimiento de textos en japonés que pueden incluir algunas letras latinas o griegas. Ahora también está disponible para el reconocimiento de tarjetas de visita
- Reconocimiento óptico de caracteres (OCR) de farsi actualizado
Mejoras en OCR e ICR
- Se dispone de coordenadas para todas las variantes de reconocimiento de caracteres (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
Apertura y preprocesamiento de imágenes
- Ahora las imágenes pueden recortarse automáticamente hasta los bordes del documento durante el preprocesamiento (IPagePreprocessingParams::CropImage)
- Se puede aplicar un filtro de reducción de ruido para mejorar la calidad del reconocimiento (IImageDocument::ApplySigmaFilter)
- Es posible detectar cuadrados negros de anclaje en la imagen (IImageDocument::FindBlackSquares)
Exportación
- La versión 2.0 de PDF se admite para exportación
- La inserción de la capa de texto admite archivos PDF etiquetados y la conformidad con el estándar PDF/A en Windows
- La exportación a PDF en Windows admite cifrado AES-256 además de RC4, así como conformidad con PDF/A-2b y PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- La exportación a PDF en Linux admite cifrado AES-256 además de RC4 y AES-128 (IPDFEncryptionInfo::EncryptionAlgorithm), así como conformidad con PDF/A-2b y PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- Compatibilidad total con PDF conformes a ZUGFeRD: los documentos exportados con IPDFExportFeatures::EnableZugferdCompliance establecido en TRUE ahora superan el validador oficial de ZUGFeRD
- La exportación a Excel admite hojas de cálculo con dirección de derecha a izquierda (IXLExportParams::CreateRtlSheets)
- La exportación a ALTO ahora admite ALTO versión 3.1 (IAltoExportParams::AltoVersion)
- La exportación a RTF permite conservar más separadores en la salida al deshabilitar el filtrado de separadores (IRTFExportParams::FilterSeparators)
- Mejor compatibilidad con separadores punteados en DOCX
- Compatibilidad con HTML 5.0 (constante HFM_Format50 de HTMLFormatModeEnum)
- Compatibilidad con documentos conformes a PDF/UA (IPDFExportFeatures::EnablePDFUACompliance)
- Modos avanzados de emulación de diseño para la exportación a TXT (ITextExportParams::LayoutRetentionMode)
API de escaneo (Windows)
- Ahora se pueden determinar automáticamente el tamaño de papel y el modo de color del escaneo (ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- Se pueden omitir las páginas vacías y corregir automáticamente la inclinación de la imagen durante el escaneo, si el escáner admite estas funciones (IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
Ejemplos de código
- Nuevo ejemplo de código que muestra la clasificación (Windows) y la clasificación (Linux y macOS) de documentos de cualquier tipo
- Ejemplo de EnginesPool para Windows actualizado para Java
- Nuevos ejemplos de código para Linux: Hello (Outproc) y Multithreading para C++ y Java. Los ejemplos muestran el procesamiento de imágenes con el motor cargado en un proceso independiente como servidor fuera de proceso
- Nuevo ejemplo para Linux SAFEARRAY_Hello. Este ejemplo muestra el procesamiento de documentos mediante el uso del tipo SAFEARRAY
Otras mejoras para Linux y Windows
- Una forma más sencilla de usar FineReader Engine en aplicaciones Java multihilo en Windows (se agregó la implementación de EnginesPool al wrapper de Java)
- Procedimiento unificado para cargar Engine para todos los tipos de licencia, incluida la licencia en línea, para que no tenga que reescribir el código al cambiar de un tipo de licencia a otro. Consulte InitializeEngine y IEngineLoader::InitializeEngine (Windows)
- Ahora es posible implementar aplicaciones multihilo en C++ en Linux
