Versão 7
Correções de segurança
Perfis predefinidos
Abertura e pré-processamento de imagem
O pré-processamento automático de imagens foi aprimorado. Muitas configurações não são mais necessárias, e algumas foram movidas de PrepareImageMode para PagePreprocessingParams. Consulte mais detalhes em Version 12 Release 7 Changes.- Para acelerar a preparação da imagem, você pode definir o tipo de documento (IPrepareImageMode::DocumentType) quando ele for conhecido, para que não seja necessário executar o classificador de documentos.
- Novos formatos de entrada: HEIF, SVG, WebP.
- Tipo de documento para desenhos técnicos com muitos trechos de texto em várias direções (DocumentTypeEnum::DT_TechnicalDrawing).
Exportação
- Agora, os dados extraídos do documento podem ser exportados no formato JSON (JsonExportParams).
Melhorias de OCR e ICR
- Marcas de seleção agora podem ser detectadas durante a análise de layout (IPageAnalysisParams::DetectCheckmarks)
- Modo de análise especial para documentos com layout complexo e tabelas (IPageAnalysisParams::AnalysisMode)
- Uma nova configuração permite salvar carimbos como imagens (IPageAnalysisParams::DetectStamps)
- O texto manuscrito passa a ser reconhecido, além do texto em letra de forma, em inglês, espanhol, francês, alemão e japonês (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- Uma nova propriedade semelhante a uma probabilidade estima a precisão do reconhecimento de caracteres (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Exemplos de código para Windows
- Novo exemplo HelloBCR para .NET Core
- Novo exemplo DataExtraction para .NET Core
Versão 5
Novo e aprimorado reconhecimento de idiomas
- Reconhecimento do idioma bangla
- Reconhecimento do idioma especial Arabic_Amount no Windows
Melhorias de OCR e ICR
- A síntese de cartões de visita agora pode ser realizada usando parâmetros adicionais (IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- Agora você pode usar o novo modo de reconhecimento Accurate (IRecognizerParams::Mode)
- Nova propriedade para verificar a presença de códigos de barras, exceto os postais (IBarcodeParams::EnableBarcodesCheck)
- Agora você pode detectar o tipo de código de barras, excluindo os postais, com a constante BT_AutodetectWithoutPostal (BarcodeTypeEnum)
- O ABBYY FineReader Engine agora reconhece códigos postais de clientes japoneses (BarcodeTypeEnum, Tipos de códigos de barras)
Abertura e pré-processamento de imagens
- Agora você pode carregar os documentos salvos por versões anteriormente compatíveis do ABBYY FineReader Engine (IFRDocument::ConvertFromOldVersion)
- Você pode obter informações sobre a presença de uma assinatura digital em um documento (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- Agora é possível verificar a confiabilidade da camada de texto (IFRDocument::CheckTextLayer)
- Modo padrão aprimorado para o processamento de arquivos PDF gerados digitalmente (SourceContentReuseModeEnum::CRM_Auto)
- Agora a aparência do arquivo PDF de saída pode ser alterada (ITextLayerInjectionParams::AllowChangePDFAView)
- Agora você pode detectar e abrir arquivos do tipo PDF Portfolio (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
Exportação
- A exportação para ALTO agora é compatível com as versões 4.0, 4.1 e 4.2 do ALTO (AltoVersionEnum)
- Novos modos de incorporação de fontes nos arquivos PDF de saída (FontEmbeddingModeEnum)
- Novas interfaces para adicionar imagens definidas pelo usuário aos PDFs de saída (IPDFPictures, IPDFPicture)
- Os formatos XLS e XPS agora estão disponíveis para exportar documentos (XLExportParams, XPSExportParams) no Linux e no macOS
Exemplos de código
- Novo exemplo Hello para .NET Core
Outras melhorias
- Agora você pode obter informações sobre o tamanho da memória alocada para o objeto de documento (IFRDocument::AllocatedSize)
- Novas opções para liberar uma Licença Online (IEngine::ReleaseOnlineLicense, “Liberar Licenças Online…” no utilitário License Manager) no Linux e no Windows
- O instalador do ABBYY FineReader Engine para Windows agora usa o Windows Installer XML Toolset (WiX)
- Nova opção LICENSEDATADIR para alterar a pasta usada para armazenar informações auxiliares (Installing the ABBYY FineReader Engine Library in Automatic Mode) no Windows
- O ABBYY FineReader Engine 12 agora pode ser executado em Azure Services no Windows
- Agora você também pode obter a data de renovação dos limites da licença para o número de páginas processadas (ILicense::VolumeRefreshingDate)
- Nova subseção que descreve a execução do Licensing Service como um usuário não root (Installing the Licensing Service) no Linux
Versão 4
Recursos especiais
- Você pode comparar dois documentos ou duas páginas (IComparator::CompareDocuments, IComparator::ComparePages)
- Os métodos da API de Comparação de Documentos ajudam a detectar alterações nos textos (IChange::GetAsTextChange) e a exportar o resultado da comparação em formato XML ou DOCX (IComparisonResult::Export)
- No Windows, você pode migrar o código que usa o ABBYY ScanDifFinder SDK para a API de Comparação de Documentos implementada no ABBYY FineReader Engine (Guia de migração do ScanDifFinder SDK para a API de Comparação de Documentos)
Melhorias de OCR e ICR
- Novos códigos de barras postais compatíveis: KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, Tipos de códigos de barras)
Abertura e pré-processamento de imagens
- O layout do documento pode ser salvo e lido a partir de um fluxo (ILayout::SaveToStream, IEngine::CreateLayoutFromStream) ou salvo como um array de bytes (ILayout::SaveToArray)
Exportação
- A exportação para PDF oferece suporte à configuração da orientação da página (IPDFExportFeatures::PageOrientation)
- A exportação para RTF oferece suporte ao ajuste das margens da página (IRTFExportParams::PageMargins) e ao aumento do tamanho da página caso o conteúdo não caiba nela (IRTFExportParams::IncreasePaperSizeToFitContent)
- A exportação para XLSX oferece suporte à incorporação de imagens no documento de saída (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
Exemplos de código
- Nova ferramenta de demonstração do Windows Document Comparison e novo exemplo Document Comparison. Eles mostram como comparar um documento ou uma página com outro.
- Exemplo CommandLineInterface atualizado para Linux e Windows.
- Novo exemplo CommandLineInterface para macOS. Este exemplo fornece a interface de linha de comando do ABBYY FineReader Engine
- Novo exemplo SAFEARRAY_Hello para macOS. Este exemplo demonstra o processamento de documentos usando o tipo SAFEARRAY
Outras melhorias
Linux e Windows
- Uma Licença Online limita o número de núcleos da CPU disponíveis para uma estação de trabalho.
- Uma Licença Online passa a exigir o uso da GoDaddy Trusted Root Certification Authority no computador em que o Serviço de Licenciamento está instalado.
- A lista de parâmetros para instalação silenciosa no Linux foi atualizada.
Versão 3
Recursos especiais
- Agora é possível extrair a MRZ das imagens do documento (IFRPage::ExtractMrz)
- Os dados extraídos da MRZ contêm campos e linhas (MrzField, MrzData, MrzLine) com informações sobre o documento e seu portador, e podem ser exportados para um arquivo XML ou arquivo JSON
Novo e aprimorado reconhecimento de idiomas
- Reconhecimento do georgiano
- Reconhecimento de fórmulas matemáticas
Abertura e pré-processamento de imagens
- Agora você também pode abrir documentos nativamente digitais usando os mesmos métodos usados para abrir imagens no Linux e no Windows; os documentos digitais serão convertidos e o conteúdo deles será carregado (OfficeConversionSettings, OfficeConverters)
- Você pode definir o limite de binarização durante o pré-processamento da imagem (IPrepareImageMode::BinarizationThreshold)
- O modo de trabalho com as páginas do documento na memória pode ser definido antes da conversão das imagens de entrada (IBatchProcessor::PageFlushingPolicy) no Linux e no Windows
Exportação
- Agora, as datas de criação e de modificação podem ser visualizadas e alteradas. Além disso, você pode configurar o modo de escrita dessas datas no documento de saída (DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). Somente datas no formato correto podem ser gravadas no documento. Se ocorrer um erro durante a exportação, especifique a data no formato correto ou altere o modo de escrita e chame o método de exportação novamente (Handling Errors During PDF/XPS Export)
- Formato de hora original no documento de saída (TimeZoneTypeEnum)
Exemplos de código
- Novo exemplo MRZExtraction para Linux e Windows. Este exemplo demonstra como extrair dados de uma zona de leitura mecânica (MRZ)
- Novo exemplo de código para Windows que mostra como implementar um temporizador para cancelar o processamento se uma chamada de método estiver demorando demais
- Novo exemplo ICR para Linux, que mostra como reconhecer texto manuscrito em letra de forma na imagem do documento
Outras melhorias
- Os blocos de dados agora podem ser ordenados de acordo com sua posição (ILayout::SortedBlocks)
- O arquivo do Contrato de Licença de Usuário Final agora está disponível no Kit de distribuição do ABBYY FineReader Engine
Linux e Windows
- O Amazon Linux AMI agora é compatível com o ABBYY FineReader Engine para Linux
- Uma Licença Online não requer nenhuma configuração específica, mas é preciso definir seus parâmetros se você quiser usar a licença com o servidor proxy
- Agora, uma Licença Online é permitida para conexões limitadas, cujo número pode ser alterado após o término do tempo de execução autônomo da licença
- O ABBYY FineReader Engine 12 agora pode ser executado em um contêiner Docker
- A lista de Java Development Kits compatíveis é apresentada em Requisitos do sistema
- O número da build do ABBYY FineReader Engine agora fica disponível antes do carregamento de seus módulos. Você pode encontrá-lo no nome do arquivo JAR incluído no Kit de distribuição do ABBYY FineReader Engine
Versão 2
Recursos especiais
- As tecnologias de classificação atualizadas oferecem suporte à classificação com base nos atributos da imagem, nas características do texto reconhecido ou na combinação das características da imagem e do texto (ClassifierTypeEnum)
- A classificação agora está disponível tanto para documentos quanto para páginas (IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- Novos modelos de classificação podem ser treinados com a técnica de validação cruzada k-fold (ValidationParams), com informações detalhadas sobre o desempenho do modelo (ValidationResult)
Novo e aprimorado reconhecimento de idiomas
- Reconhecimento do idioma birmanês
- Japonês (moderno) aprimorado para melhorar o reconhecimento de textos em japonês que podem incluir algumas letras latinas ou gregas. Agora também está disponível para reconhecimento de cartões de visita
- OCR de farsi atualizado
Melhorias de OCR e ICR
- As coordenadas estão disponíveis para todas as variantes de reconhecimento de caracteres (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
Abertura e pré-processamento de imagens
- Agora, as imagens podem ser recortadas automaticamente nas bordas do documento durante o pré-processamento (IPagePreprocessingParams::CropImage)
- O filtro de redução de ruído pode ser aplicado para melhorar a qualidade do reconhecimento (IImageDocument::ApplySigmaFilter)
- É possível localizar quadrados pretos de ancoragem na imagem (IImageDocument::FindBlackSquares)
Exportação
- A versão 2.0 do PDF é compatível com exportação
- A injeção da camada de texto oferece suporte a arquivos PDF com tags e à conformidade com o padrão PDF/A no Windows
- A exportação para PDF no Windows oferece suporte à criptografia AES-256, além de RC4, e à conformidade com PDF/A-2b e PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- A exportação para PDF no Linux oferece suporte à criptografia AES-256, além de RC4 e AES-128 (IPDFEncryptionInfo::EncryptionAlgorithm), e à conformidade com PDF/A-2b e PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- Suporte completo a PDF compatível com ZUGFeRD: documentos exportados com IPDFExportFeatures::EnableZugferdCompliance definido como TRUE agora passam pelo validador oficial do ZUGFeRD
- A exportação para Excel oferece suporte à direção da planilha da direita para a esquerda (IXLExportParams::CreateRtlSheets)
- A exportação para ALTO agora oferece suporte à versão 3.1 do ALTO (IAltoExportParams::AltoVersion)
- A exportação para RTF permite preservar mais separadores na saída ao desativar a filtragem de separadores (IRTFExportParams::FilterSeparators)
- Melhor suporte a separadores pontilhados no DOCX
- Suporte a HTML 5.0 (constante HFM_Format50 de HTMLFormatModeEnum)
- Suporte a documentos compatíveis com PDF/UA (IPDFExportFeatures::EnablePDFUACompliance)
- Modos avançados de emulação de layout para exportação em TXT (ITextExportParams::LayoutRetentionMode)
API de digitalização (Windows)
- O tamanho do papel e o modo de cor da digitalização agora podem ser definidos automaticamente (ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- Páginas em branco podem ser ignoradas, e a inclinação da imagem pode ser corrigida automaticamente durante a digitalização, se o scanner oferecer suporte a esses recursos (IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
Exemplos de código
- Novo exemplo de código que demonstra Classification (Windows) e Classification (Linux e macOS) de documentos de todos os tipos
- Exemplo atualizado do EnginesPool para Windows em Java
- Novos exemplos de código para Linux: Hello (Outproc) e Multithreading, para C++ e Java. Os exemplos demonstram o processamento de imagens com o Engine carregado em um processo separado como servidor out-of-process
- Novo exemplo para Linux SAFEARRAY_Hello. Este exemplo demonstra o processamento de documentos com o uso do tipo SAFEARRAY
Outras melhorias para Linux e Windows
- Maneira mais fácil de usar o FineReader Engine em aplicativos Java multithread no Windows (implementação do EnginesPool adicionada ao wrapper Java)
- Procedimento unificado de carregamento do Engine para todos os tipos de licença, incluindo a Licença Online, para que você não precise reescrever seu código ao mudar de um tipo de licença para outro. Consulte InitializeEngine e IEngineLoader::InitializeEngine (Windows)
- Agora é possível implementar aplicativos multithread em C++ no Linux
