- Pré-processamento de arquivos digitalizados ou imagens
- Reconhecimento com restauração completa da estrutura e da formatação do documento
- Comparação de documentos ou páginas
- Exportação para um formato externo
Implementação do cenário
Os exemplos de código fornecidos neste tópico são específicos para Windows.
Etapa 1. Carregando o ABBYY FineReader Engine
Etapa 1. Carregando o ABBYY FineReader Engine
Para começar a trabalhar com o ABBYY FineReader Engine, você precisa criar o objeto Engine. O objeto Engine é o objeto principal na hierarquia de objetos do ABBYY FineReader Engine e fornece várias configurações globais, alguns métodos de processamento e métodos para criar os demais objetos.Para criar o objeto Engine, você pode usar a função InitializeEngine. Veja também outras formas de carregar o objeto Engine (Win).
C#
Etapa 2. Carregamento e pré-processamento de arquivos e imagens
Etapa 2. Carregamento e pré-processamento de arquivos e imagens
O ABBYY FineReader Engine fornece o objeto FRDocument, que permite processar documentos com várias páginas. O uso desse objeto permite preservar a organização lógica do documento, mantendo o texto original, as colunas, as fontes, os estilos etc. Use o objeto FRPage se quiser comparar páginas.Para carregar imagens de um único documento e pré-processá-las, você deve criar o objeto FRDocument e adicionar as imagens a ele. Você pode fazer uma das seguintes opções:
- Criar o objeto FRDocument usando o método CreateFRDocumentFromImage do objeto Engine. Esse método cria o objeto FRDocument e carrega as imagens do arquivo especificado.
- Criar o objeto FRDocument com o método CreateFRDocument do objeto Engine e, em seguida, adicionar imagens ao objeto FRDocument criado a partir de um arquivo (use os métodos AddImageFile, AddImageFileWithPassword ou AddImageFileWithPasswordCallback do objeto FRDocument).
C#
Etapa 3. Reconhecimento de documentos
Etapa 3. Reconhecimento de documentos
Para reconhecer um documento, sugerimos usar os métodos de análise e reconhecimento do objeto FRDocument. Esse objeto oferece um conjunto completo de métodos para análise, reconhecimento e síntese de documentos. O método mais conveniente, que reúne análise, reconhecimento e síntese em uma única operação, é o método Process. Ele também utiliza da forma mais eficiente os recursos de processamento simultâneo de sistemas multiprocessados e multicore. No entanto, você também pode executar o pré-processamento, a análise, o reconhecimento e a síntese de forma sequencial usando os métodos Preprocess, Analyze, Recognize e Synthesize.
Você pode definir os parâmetros de reconhecimento dos seus documentos carregando um perfil predefinido adequado (consulte Working with Profiles para mais informações).
Você pode definir os parâmetros de reconhecimento dos seus documentos carregando um perfil predefinido adequado (consulte Working with Profiles para mais informações).
C#
Etapa 4. Comparação de documentos ou páginas
Etapa 4. Comparação de documentos ou páginas
Para comparar os documentos ou as páginas com suas cópias:
- Certifique-se de que sua licença do ABBYY FineReader Engine oferece suporte ao módulo Compare Documents.
- Crie um objeto Comparator usando o método CreateComparator do objeto Engine.
- [opcional] Use o objeto ComparisonParams para definir as propriedades com os valores desejados.
- Chame o método CompareDocuments do objeto Comparator para comparar o documento original com a cópia. Você receberá um objeto ComparisonResult contendo informações sobre as alterações detectadas.
C#
Etapa 5. Trabalhando com as alterações detectadas
Etapa 5. Trabalhando com as alterações detectadas
O objeto ComparisonResult contém a lista completa de diferenças e fornece métodos para obtê-las para páginas individuais. Você pode acessar as alterações no documento original e em sua cópia com os métodos GetChangesForReferencePage e GetChangesForUserPage. Use o objeto ChangeLocation para obter informações sobre a localização da alteração e a propriedade RegionForPage para obter a região da alteração na página especificada.
C#
Etapa 6. Exportando o resultado da comparação
Etapa 6. Exportando o resultado da comparação
Para exportar o resultado da comparação, chame o método Export do objeto ComparisonResult e passe o caminho do arquivo como parâmetro de entrada. Os dados podem ser salvos em XML ou em um arquivo DOCX com controle de alterações.C#
Etapa 7. Descarregando o ABBYY FineReader Engine
Etapa 7. Descarregando o ABBYY FineReader Engine
Depois de concluir o trabalho com o ABBYY FineReader Engine, você precisa descarregar o objeto Engine. Para isso, use a função exportada DeinitializeEngine.
C#
Recursos necessários
Otimização adicional para tarefas específicas
- Digitalização - Somente Windows
- Digitalização
Descrição do cenário do ABBYY FineReader Engine para digitalização de documentos.
- Digitalização
- Reconhecimento
- Ajuste de parâmetros de pré-processamento, análise, reconhecimento e síntese
Personalização do processamento de documentos usando objetos de parâmetro de análise, reconhecimento e síntese. - PageProcessingParams Object
Esse objeto permite personalizar os parâmetros de análise e reconhecimento. Com esse objeto, você pode indicar quais características da imagem e do texto devem ser detectadas (imagem invertida, orientação, códigos de barras, idioma de reconhecimento, margem de erro de reconhecimento). - SynthesisParamsForPage Object
Esse objeto inclui parâmetros responsáveis por restaurar a formatação de uma página durante a síntese. - SynthesisParamsForDocument Object
Esse objeto permite personalizar a síntese do documento: restaurar sua estrutura e formatação. - MultiProcessingParams Object - Disponível para Linux e Windows
O processamento simultâneo pode ser útil ao processar um grande número de imagens. Nesse caso, a carga de processamento será distribuída entre os núcleos do processador durante a abertura e o pré-processamento da imagem, a análise de layout, o reconhecimento e a exportação, o que possibilita acelerar o processamento.
Os modos de leitura (simultâneo ou consecutivo) são definidos usando a propriedade MultiProcessingMode. A propriedade RecognitionProcessesCount controla o número de processos que podem ser iniciados.
- Ajuste de parâmetros de pré-processamento, análise, reconhecimento e síntese
