Pular para o conteúdo principal
O resultado do reconhecimento de documentos depende das fontes usadas durante o processamento e de suas configurações. O ABBYY FineReader Engine permite usar as fontes disponíveis, mas há casos em que é necessário definir as fontes manualmente:
  • Seu documento contém fontes específicas (por exemplo, fontes não latinas)
  • Você usa um sistema operacional com um conjunto limitado de fontes ou sem fontes. Por exemplo:
  • Windows Server Core em um contêiner Docker
  • Qualquer versão de servidor de uma distribuição Linux sem interface gráfica do usuário
Nesses casos, é importante definir as fontes antes de iniciar a aplicação, pois várias etapas do processamento exigem o uso de fontes corretamente configuradas:
  • Abertura de PDF
  • Síntese de documentos
  • Exportação para PDF
Este artigo traz informações úteis sobre como definir fontes manualmente e descreve as funções do ABBYY FineReader Engine destinadas ao trabalho com fontes.

Abertura de PDF

Ao abrir arquivos PDF, são usadas as fontes do sistema. Se você precisar de fontes adicionais, poderá instalá-las com o utilitário do sistema Font Book.
O PDF contém informações sobre quais fontes foram usadas para criá-lo. Essas informações são necessárias para a rasterização do PDF, por exemplo, para processar o texto visível na imagem e determinar as fontes usadas e seus parâmetros. Para abrir o PDF de saída com as fontes exibidas corretamente, use um dos métodos a seguir:
  • copie manualmente as fontes desejadas para a pasta Data/Resources/Font no pacote de distribuição. Esse método não registra as fontes no sistema operacional e afeta apenas a abertura do PDF. Por padrão, as fontes dessa pasta não são usadas durante a síntese e a exportação de documentos.
  • copie manualmente as fontes desejadas para a pasta do sistema /usr/share/fonts. Esse método registra as fontes no sistema operacional. As fontes dessa pasta serão usadas na síntese ou exportação de documentos se você as especificar na propriedade ISynthesisParamsForDocument::FontSet (consulte a seção Síntese de documentos e exportação para PDF). Por padrão, essas fontes são usadas durante a síntese somente se tiverem sido incorporadas ao PDF de entrada (consulte a descrição do filtro FNF_Auto na enumeração FontNamesFiltersEnum).
  • instale o pacote de instalação de fontes (use o pacote ttf-mscorefonts-installer em sistemas do tipo Debian e o pacote msttcore-fonts-installer em sistemas do tipo RHEL). Esse método instala as fontes automaticamente e segue as mesmas particularidades de configuração de fontes para síntese e exportação do método anterior.
Após copiar as fontes para a pasta do sistema ou instalá-las com o pacote em alguns sistemas operacionais, você precisará atualizar o cache de fontes com o comando fc-cache -f.
As fontes que precisam ser incluídas:
  • Arial
  • Times New Roman
  • Courier New
Para detectar os vários estilos de uma mesma fonte no texto, recomendamos incluir vários estilos básicos dessa fonte de uma só vez (regular, negrito e itálico).
Windows
O PDF contém informações sobre quais fontes foram usadas para criá-lo. Essas informações são necessárias para a rasterização do PDF, por exemplo, para processar o texto visível na imagem e determinar as fontes usadas e seus parâmetros. Para abrir o PDF de saída com as fontes exibidas corretamente, é necessário copiar os arquivos das fontes necessárias para a pasta Data\Resources\Font no pacote de distribuição. O ABBYY FineReader Engine incorporará essas fontes automaticamente durante a execução.As fontes que precisam ser incluídas:
  • Arial
  • Times New Roman
  • Courier New

Síntese de documentos e exportação para PDF

Ao sintetizar o documento ou exportá-lo para PDF, o ABBYY FineReader Engine seleciona a melhor fonte do conjunto de fontes especificado na propriedade ISynthesisParamsForDocument::FontSet. Por padrão, a quantidade de fontes nesse conjunto é otimizada para equilibrar a velocidade de processamento e a qualidade dos documentos gerados. Para definir as fontes manualmente:
  1. Escolha qualquer pasta na sua máquina para ser usada como armazenamento de fontes.
  2. Copie os arquivos das fontes necessárias para essa pasta. As fontes recomendadas para síntese de documentos e exportação estão listadas na enumeração FontNamesFiltersEnum.
  3. Especifique a pasta com as fontes usando a propriedade Folder do objeto CustomFontSet.
Use as recomendações abaixo caso precise alterar o conjunto de fontes padrão:
  • Com o FRE para Linux, você pode usar as fontes da seção de abertura de PDF não apenas para abrir PDFs, mas também ao sintetizar e exportar qualquer documento de entrada. Para isso, especifique na propriedade Folder do objeto CustomFontSet o caminho para a pasta de fontes que você escolheu anteriormente na seção de abertura de PDF.
  • Você pode usar um filtro de fontes predefinido para um idioma específico, por exemplo, FNF_Chinese, FNF_Japanese. Use a propriedade FontNamesFilter do objeto SystemFontSet ou CustomFontSet.
  • Você pode especificar famílias de fontes específicas usadas no seu documento na propriedade FontNamesCustomFilter do objeto SystemFontSet ou CustomFontSet.
  • Você pode especificar o filtro FNF_FineReader para as fontes na propriedade FontNamesFilter do objeto SystemFontSet ou CustomFontSet. Esse filtro permite que o FineReader Engine use mais fontes durante a síntese do documento e selecione fontes mais adequadas em comparação com o modo padrão. No entanto, a velocidade de processamento pode diminuir. Isso pode ser útil, por exemplo, ao converter para um formato editável. Antes de especificar esse filtro, verifique a lista de fontes que ele usa e certifique-se de que essas fontes estejam presentes na sua estação de trabalho.
Para a síntese de documentos com fontes do sistema no macOS 10.15 Catalina ou superior, são necessárias ações adicionais (consulte a seção Frequently Asked Questions).

Veja também

Trabalho com idiomas Execução do ABBYY FineReader Engine 12 em um contêiner Docker (Linux e Windows)