Pular para o conteúdo principal
O formato PDF é frequentemente usado em sistemas de arquivamento eletrônico para armazenamento de dados. Ele é o formato preferido por sua versatilidade e pela capacidade de preservar imagens e texto. As tecnologias desenvolvidas pela ABBYY permitem salvar textos reconhecidos nos formatos PDF e PDF/A. Um dos principais objetivos do arquivamento é obter o menor tamanho de arquivo possível sem perda de qualidade dos dados. Uma tecnologia especial de compactação chamada MRC (Mixed Raster Content) é usada para minimizar o tamanho dos arquivos PDF e PDF/A.

Entrada de PDF para Linux e Windows

Processamento inteligente de PDF

O ABBYY FineReader Engine analisa informações internas contidas nos arquivos PDF de origem, como:

  • anotações,
  • metadados,
  • objetos de texto,
  • dicionários de fontes
  • fluxo de conteúdo

O SDK melhora o desempenho e a velocidade da conversão de PDF por meio de uma seleção de texto eficiente e precisa. Se o texto estiver incorporado ao arquivo PDF, o mecanismo de OCR (Optical Character Recognition) verifica a integridade da camada de texto e decide se extrai o texto ou se aplica OCR bloco a bloco.

Captura de informações internas do PDF

Ele extrai links internos do PDF, hiperlinks e propriedades do documento, como assunto, autor, título e palavras-chave.

As restrições aplicadas ao documento PDF de entrada influenciarão a importação e o processamento do documento. Por exemplo, se não for permitido copiar texto, o documento PDF não será processado. Verifique se os arquivos PDF que você vai processar não estão protegidos contra cópia.

Saída em PDF

Suporte à segurança e criptografia de PDF

O ABBYY FineReader Engine 12 oferece suporte a diversas configurações de segurança de PDF, ampliando sua aplicabilidade para órgãos governamentais e outras organizações que exigem alto nível de segurança.

  • Configurações de senha para “Abrir arquivo” projetadas para impedir o acesso não autorizado a um documento.
  • Restrição de determinadas operações, como impressão, edição ou extração do conteúdo do arquivo, por meio da atribuição de senhas de permissão.
  • Suporte aos padrões de criptografia mais recentes.

intro_KeyFeatures_PDFConversion

Saída no formato Tagged PDF

O Tagged PDF pode ser reformatado para se ajustar a diferentes larguras de página ou tela. Ideal para uso com dispositivos portáteis (PDAs) ou leitores de tela normalmente usados por pessoas com deficiência visual.

Tamanho da página

Possibilidade de definir o tamanho de todas as páginas de um arquivo de saída durante a conversão para PDF.

Exportação de metadados

O ABBYY FineReader Engine 12 permite exportar metadados (marcadores, hiperlinks, referências cruzadas etc.).

Conversão para o formato PDF/A

Conversão para o formato PDF/A, recomendado como padrão para a preservação de longo prazo de documentos orientados por página.

As tecnologias da ABBYY permitem salvar documentos em formatos PDF/A com diferentes níveis de conformidade: PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u.

O formato PDF/A-1a apresenta os seguintes recursos: melhor preservação da formatação do documento, da estrutura lógica e da aparência original, bem como a possibilidade de preservar a aparência do documento em telas de diferentes tamanhos (o conteúdo do documento é organizado de uma maneira específica para isso).

O formato PDF/A-1b é usado apenas para reproduzir a aparência do documento.

Os formatos PDF/A-2a, PDF/A-2b e PDF/A-2u oferecem suporte à compressão de imagem JPEG 2000, transparência e camadas. A diferença é que todo o texto em PDF/A-2u tem mapeamento Unicode.

Os formatos PDF/A-3a, PDF/A-3b e PDF/A-3u oferecem suporte à anexação de documentos em quaisquer formatos (como Excel, Word, HTML, CAD, XML) a um documento PDF.

Conversão para o formato PDF/UA

O ABBYY FineReader Engine 12 oferece suporte à exportação para PDF em conformidade com o padrão PDF/UA. O formato PDF/UA oferece suporte a Tagged PDF e tecnologias assistivas.

Exportação de CJK para PDF

Permite converter documentos em chinês (simplificado e tradicional), japonês e coreano para o formato PDF.

Compressão MRC em PDF (PDF/A)

Uma tecnologia especial de compressão chamada MRC (Mixed Raster Content) é usada para minimizar o tamanho dos arquivos PDF e PDF/A. intro_KeyFeatures_PDFConversion2 Os arquivos de imagem de documentos geralmente são muito grandes devido ao plano de fundo, que muitas vezes representa até 90% do tamanho do arquivo. No entanto, esse plano de fundo pode ser desnecessário no documento resultante. O que importa é o texto e as imagens. A tecnologia de compressão MRC permite identificar o plano de fundo colorido e removê-lo ou compactá-lo em alto grau. Assim, o texto e as imagens permanecem sobre um fundo branco, contribuindo para reduzir o tamanho do arquivo. Os objetos de imagem (diagramas, gráficos, logotipos, fotos, desenhos, carimbos, assinaturas etc.) também são ligeiramente comprimidos, mas apenas em um nível que não comprometa a qualidade. A tecnologia MRC analisa os contornos de caracteres semelhantes no documento, cria um modelo médio de caractere e o usa no lugar do próprio caractere. Isso melhora a legibilidade, porque alguns defeitos do texto são corrigidos, e os contornos dos caracteres se tornam mais precisos. Como resultado, você obtém uma imagem menor, com aparência ainda melhor do que antes. O documento resultante terá um plano de fundo discreto e uniforme, com texto e imagens nítidos. Essa “reconstrução” do documento pode ser útil quando você precisa lidar com imagens de baixa qualidade devido a: iluminação ruim, foto fora de foco, parâmetros incorretos de digitalização/fotografia, papel escuro sem revestimento ou deterioração do documento. Tudo isso faz com que a imagem tenha um fundo escuro com texturas adicionais. O texto fica borrado e difícil de ler. A tecnologia MRC proporciona uma aparência melhor ao documento e um tamanho de arquivo até 8 a 10 vezes menor do que com JPEG.

Conversão de PDF simples e clara

O ABBYY FineReader Engine oferece aos desenvolvedores ferramentas especiais para alcançar o modo de conversão de PDF ideal para suas necessidades específicas.
Cenário de exportação de PDFDescrição
MaxQualityOtimize a exportação em PDF (PDF/A) para obter a melhor qualidade possível no arquivo resultante.
BalancedA exportação em PDF (PDF/A) será equilibrada entre a qualidade do arquivo resultante, seu tamanho e o tempo de processamento.
MinSizeOtimize a exportação em PDF (PDF/A) para obter o menor tamanho possível do arquivo resultante.
MaxSpeedOtimize a exportação em PDF (PDF/A) para obter a maior velocidade de processamento.

Veja também

Principais recursos