Por que aprimorar imagens?


Pré-processamento de Imagem
Este recurso de digitalização de documentos é muito importante para a entrada em massa de imagens quando a orientação em que as páginas do documento são digitalizadas é desconhecida e pode variar. O sistema detecta automaticamente a orientação de cada página e a corrige quando necessário. | |
Utilizado para digitalizar livros em páginas duplas — tanto a página esquerda quanto a direita. A qualidade do reconhecimento é maior quando a página é dividida em duas, com cada metade correspondendo a uma única página do livro. O reconhecimento e a análise de layout são então realizados separadamente para cada página, com a correção de inclinação aplicada quando necessário. | |
É uma função essencial de processamento de documentos digitalizados que requer compensação de inclinação de imagem. Não exige bordas ou linhas de referência. O novo ABBYY FineReader Engine 12 oferece vários métodos para correção de inclinação de imagens: com pares de quadrados pretos, linhas ou linhas de texto. | |
Ao capturar texto de livros digitalizados ou fotografados, as linhas de texto podem ficar irregulares e difíceis de processar por OCR. As tecnologias ABBYY oferecem algoritmos especiais que corrigem a inclinação e endireitam as linhas de texto para um reconhecimento de texto preciso. | |
Ao digitalizar documentos de qualidade baixa a média, é possível obter imagens com muito ruído, contendo inúmeros pontos ou manchas. Essas manchas, quando aparecem próximas a letras ou números, podem comprometer a qualidade do OCR. Este recurso remove esse tipo de ruído. O tamanho das manchas a serem removidas pode ser definido pelo usuário. Pode ser aplicado a uma imagem inteira, bem como a qualquer bloco (ou zona) individual da imagem. | |
Esta tecnologia identifica automaticamente fotos digitais e corrige distorções tipicamente introduzidas por câmeras digitais. O sistema reconhece os defeitos típicos encontrados em imagens digitais, como linhas de texto distorcidas, distorções 3D trapezoidais, foco ruim, borrões, áreas escurecidas em páginas opostas de livros espessos, reflexos, ruído ISO, entre outros. Esses defeitos são corrigidos automaticamente pelo sistema, dispensando o uso de aplicativos de terceiros para o tratamento das fotos.
| |
A tecnologia de filtragem de textura ajuda a eliminar o “ruído” de fundo, como cor e textura, aumentando a precisão no processamento de documentos de difícil leitura, como jornais impressos, documentos coloridos, faxes e cópias.
| |
Este é o processo de conversão de imagens para preto e branco, com remoção de ruído, plano de fundo e texturas, além da obtenção de texto nítido. O processo garante a melhor qualidade de OCR. Os parâmetros necessários são identificados separadamente para cada fragmento. No caso de jornais finos, o texto impresso no verso pode aparecer visível nas digitalizações. A binarização adaptativa remove esse texto. A inovadora tecnologia de Binarização Adaptativa ajusta dinamicamente o limiar de brilho para cada fragmento de imagem durante o reconhecimento. Ao aplicar parâmetros de reconhecimento individuais, ela produz resultados precisos para documentos com fundo e texturas de contraste variável em cinza ou colorido. | |
Este é o processo de binarização de imagens em escala de cinza usando pontos muito pequenos. Ele melhora a aparência do documento, fazendo com que ele pareça ter mais tonalidades. | |
Filtros para imagens binárias | |
|---|---|
Redimensionamento da imagem | Para documentos digitalizados em baixa resolução (menos de 120 dpi) e documentos com fontes pequenas (menos de 10 pt), as imagens podem ser ampliadas digitalmente para melhorar a qualidade do OCR. |


