OCR (Optical Character Recognition) e outras tecnologias de reconhecimento

Reconhecimento Óptico de Caracteres (OCR (Optical Character Recognition))

A tecnologia de OCR (Optical Character Recognition) — reconhecimento de texto impresso — está disponível para 211 idiomas, incluindo:
- Idiomas europeus (alfabetos latino, cirílico, armênio e grego)
- Chinês (simplificado e tradicional), japonês e coreano (CJK)
- Árabe, tailandês, vietnamita, hebraico e farsi
- Birmanês — versão preliminar técnica
- FineReader XIX — um módulo de OCR (Optical Character Recognition) desenvolvido especificamente para digitalizar e arquivar documentos antigos, livros e jornais publicados entre os séculos XVII e XX, muitos dos quais são raros e únicos. Armazenados nos arquivos históricos de bibliotecas e organizações governamentais, eles constituem um patrimônio nacional que deve ser preservado. O FineReader XIX oferece um recurso exclusivo para reconhecer textos publicados no período de 1600 a 1937 em inglês, francês, alemão, italiano e espanhol. Ele oferece suporte ao reconhecimento de fontes antigas, como Fraktur, Schwabacher e a maioria das fontes góticas.

56 idiomas contam com suporte a dicionário/morfologia, o que melhora significativamente a precisão do OCR (Optical Character Recognition).
O recurso de reconhecimento de documentos multilíngues permite reconhecer vários idiomas, por exemplo, alemão e chinês; inglês, russo e coreano em um mesmo documento.
Reconhecimento de documentos em matriz de pontos — o ABBYY FineReader Engine reconhece textos impressos em matriz de pontos de vários tipos. Ele foi treinado com vários milhares de amostras produzidas por diversos tipos de impressoras, incluindo matriciais, de margarida, de corrente e de banda, bem como com os modos de impressão rascunho e Near Letter Quality (NLQ).
Reconhecimento de documentos datilografados.
Reconhecimento das fontes OCR-A, OCR-B, MICR (E13B) e CMC7.

Consulte a lista completa de idiomas compatíveis e os tipos de texto.

Reconhecimento Inteligente de Caracteres (ICR)

Tecnologia ICR — reconhecimento de caracteres manuscritos em letra de forma para mais de 126 idiomas.
39 idiomas (com alfabetos latino, grego e cirílico) com suporte a morfologia/dicionário.
ICR para algarismos indianos usados em países árabes.
30 estilos regionais de escrita manuscrita em letra de forma usados em diferentes países e regiões do mundo (para os idiomas compatíveis com ICR).
Reconhecimento de caracteres manuscritos em letra de forma em campos e molduras — campos sublinhados, caixas, campos do tipo comb etc.
ICR multilíngue. Uma das principais vantagens da tecnologia ICR da ABBYY é oferecer praticamente o mesmo alto nível de precisão para algarismos e para algarismos combinados com letras de um ou mais idiomas, mesmo que os campos contenham letras maiúsculas e minúsculas.

Reconhecimento Óptico de Marcas (OMR)

A tecnologia OMR da ABBYY reconhece marcas de seleção simples, marcas de seleção agrupadas, marcas de seleção de modelo e marcas de seleção com “correções” feitas à mão em diferentes variações:

marcas de seleção em molduras quadradas
marcas de seleção sobre fundo em branco
tipos de marcas de seleção não padrão (marcas de seleção especiais exigem treinamento antes de poderem ser reconhecidas)

O OMR oferece uma taxa de precisão de 99,995 %

Reconhecimento óptico de códigos de barras (OBR)

Tipos de códigos de barras 1D e 2D. O ABBYY OCR SDK oferece suporte ao reconhecimento dos tipos mais comuns de códigos de barras 1D e 2D. Consulte a lista de tipos de códigos de barras compatíveis.
Extração rápida de códigos de barras. Esse recurso permite a detecção e o reconhecimento automáticos de códigos de barras em documentos, em qualquer ângulo. Ele funciona tanto com códigos de barras 1D quanto 2D

Modos de reconhecimento

Com os modos de processamento predefinidos do Engine, os desenvolvedores podem configurar e ajustar rapidamente a velocidade e a precisão do processamento da forma mais adequada às suas necessidades. Além do modo de processamento padrão, o reconhecimento por OCR (Optical Character Recognition) e por ICR pode ser executado nos modos de reconhecimento normal, rápido e preciso:

Modo de reconhecimento preciso

É o modo mais preciso para obter a mais alta qualidade de reconhecimento. Esse modo é altamente recomendado se você pretende reutilizar o conteúdo reconhecido e em outras tarefas nas quais a precisão seja um fator crítico.

Modo de reconhecimento rápido

Ele foi projetado para o processamento de grandes volumes de documentos e para casos em que a velocidade é o fator principal. Esse modo aumenta a velocidade de processamento em 200–250%, tornando a tecnologia ideal para uso em sistemas de gerenciamento de conteúdo (CMS), gerenciamento de documentos (DMS) e arquivamento.

Modo de reconhecimento normal

Ele define valores intermediários de precisão e velocidade de reconhecimento entre os modos Preciso e Rápido. Em geral, oferece maior velocidade com praticamente o mesmo nível de precisão do modo Preciso.

Reconhecimento de Texto Completo e em Nível de Campo

Há dois tipos de reconhecimento que podem ser distinguidos: reconhecimento de texto completo e reconhecimento em nível de campo. A principal diferença é que o reconhecimento de texto completo geralmente inclui a tecnologia OCR e é usado para conversão de documentos. O reconhecimento em nível de campo inclui OCR, ICR e outras tecnologias usadas em áreas específicas para reconhecer e extrair dados específicos. A tabela a seguir mostra as especificações desses tipos de reconhecimento:

Especificação	Reconhecimento de texto completo	Reconhecimento em nível de campo
Onde é usado	Conversão de documentos, arquivamento de livros	Captura de dados
---	---	---
Análise de documentos	Análise geral de documentos, análise de documentos para faturas, análise de documentos para indexação de texto completo	Especificação manual de blocos para reconhecimento em nível de campo
Reconhecimento	OCR com precisão geral de cerca de 96 a 99%	OCR, ICR, OMR e reconhecimento de códigos de barras com tipos de dados e intervalos de valores predefinidos. A precisão é de cerca de 100%
Verificação	Recomendada para reutilização de conteúdo	Obrigatória na maioria dos casos
Síntese	Usada para recuperação de documentos	Não usada
Exportação dos resultados do reconhecimento	Arquivos de documento (RTF, DOCX, PDF etc.)	Exportação para arquivo XML ou banco de dados

Reconhecimento de texto completo O reconhecimento de texto completo é um tipo básico de reconhecimento para diferentes tarefas, como:

Arquivamento de documentos
Conversão de documentos para reutilização de conteúdo
Extração de texto bruto para detecção de campos e classificação de documentos

Todas elas exigem o reconhecimento (OCR) de todo o texto do documento (página). Antes do reconhecimento, a análise do documento geralmente faz a divisão e a correção da orientação das páginas, além da detecção de blocos de texto, imagens e outros objetos. Em seguida, após o OCR, a síntese do documento reconstrói sua estrutura e layout (para a tarefa de reutilização de conteúdo) ou simplesmente recupera a ordem correta do texto em documentos complexos com várias colunas de texto e imagens (para o cenário de arquivamento). O texto resultante é exportado, dependendo da tarefa, como texto simples ou como um documento em um formato compatível. O texto pode ser verificado manualmente para aumentar sua precisão, especialmente para reutilização futura. Reconhecimento em nível de campo O ABBYY FineReader Engine 12 oferece recursos completos de reconhecimento em nível de campo para dar suporte a processos de negócios importantes, como processamento de formulários, classificação por palavras-chave e indexação por palavras-chave. Funções avançadas de processamento de imagem ampliam sua capacidade de detectar de forma inteligente pequenas áreas de zona, independentemente da qualidade e de particularidades gráficas que possam afetar a precisão do reconhecimento (ou seja, texto sublinhado, ruído pós-digitalização, espaços no texto etc.) A funcionalidade principal para reconhecimento em nível de campo, ou zonal, inclui OCR multilíngue, ICR, OMR, reconhecimento de códigos de barras e uma variedade de funções específicas, como:

Extração de dados de campos com várias bordas e molduras, incluindo caixas de combinação, campos sublinhados, caixas e até campos em que os dados não cabem dentro da borda do campo
Definição do conteúdo do campo por meio da configuração de alfabetos, dicionários, expressões regulares, tipos de segmentação, estilos de escrita manual (somente Windows) etc.
Detecção de espaçamento dentro do campo, reconhecendo com precisão campos em que espaços são permitidos. O ABBYY FineReader Engine 12 também permite o uso de dicionários que contêm combinações de palavras com espaços
Processamento inteligente de blocos com partes e linhas que se cruzam, fornecendo reconhecimento de texto (palavras e símbolos) localizado inteiramente dentro das bordas do bloco, economizando tempo com o reconhecimento de blocos de texto irrelevantes
Remoção de ruído em blocos de texto, com a capacidade de especificar o tamanho do “lixo” branco ou preto

O reconhecimento em nível de campo conta com ferramentas especiais do Engine para desenvolvedores, como a Voting API e o ajuste de reconhecimento “On-the-Fly”. Para mais detalhes, consulte Ferramentas avançadas de desenvolvimento.

Idiomas do usuário

O ABBYY FineReader Engine oferece uma API para criar e editar idiomas de reconhecimento, criar cópias de idiomas de reconhecimento predefinidos e ajustá-los, além de adicionar novas palavras aos idiomas do usuário. Por exemplo, se um documento contiver “estruturas” como códigos de produto, números de telefone, números de passaporte etc., poderão ocorrer erros de reconhecimento. Isso acontece porque o programa lê essas estruturas letra por letra. Para melhorar o reconhecimento de códigos de produto e elementos semelhantes, você pode criar um novo idioma de reconhecimento que ajudará o programa a ler corretamente tipos específicos de dados. Abaixo estão dois exemplos que ilustram como os idiomas do usuário podem ajudar a melhorar a qualidade do reconhecimento:

Em documentos preenchidos à mão, os valores nos campos do formulário geralmente pertencem a um conjunto específico, como nomes de cidades, países, CEPs, códigos de produto, valores etc. Para melhorar a qualidade do reconhecimento por ICR, você pode usar idiomas do usuário para descrever as informações que podem ser inseridas em cada campo.
Se um documento contiver “estruturas” como códigos de produto, números de telefone, números de passaporte etc., poderão ocorrer erros de reconhecimento. Isso acontece porque o programa lê essas estruturas letra por letra. Para melhorar o reconhecimento de códigos de produto e elementos semelhantes, você pode criar um novo idioma de reconhecimento que ajudará o programa a ler corretamente tipos específicos de dados.

Treinamento de padrões

Na grande maioria dos casos, o ABBYY FineReader Engine consegue ler textos sem treinamento prévio. No entanto, em casos como o reconhecimento de fontes decorativas ou contornadas, ou o processamento em lote de documentos com baixa qualidade de impressão, o treinamento prévio de padrões pode ser útil. O SDK de OCR permite criar e usar padrões do usuário diretamente via API. Você pode treinar os padrões carregando imagens e associando-as aos caracteres correspondentes.

Veja também

Principais recursos Tour guiado: treinamento de padrões de usuário - Apenas para Windows Ferramentas avançadas de desenvolvimento

Visão geral

Principais recursos novos

OCR (Optical Character Recognition) e outras tecnologias de reconhecimento

Reconhecimento Óptico de Caracteres (OCR (Optical Character Recognition))

Reconhecimento Inteligente de Caracteres (ICR)

Reconhecimento Óptico de Marcas (OMR)

Reconhecimento óptico de códigos de barras (OBR)

Modos de reconhecimento

Reconhecimento de Texto Completo e em Nível de Campo

Idiomas do usuário

Treinamento de padrões

Veja também

Visão geral

Principais recursos novos

​Reconhecimento Óptico de Caracteres (OCR (Optical Character Recognition))

​Reconhecimento Inteligente de Caracteres (ICR)

​Reconhecimento Óptico de Marcas (OMR)

​Reconhecimento óptico de códigos de barras (OBR)

​Modos de reconhecimento

​Reconhecimento de Texto Completo e em Nível de Campo

​Idiomas do usuário

​Treinamento de padrões

​Veja também

Reconhecimento Óptico de Caracteres (OCR (Optical Character Recognition))

Reconhecimento Inteligente de Caracteres (ICR)

Reconhecimento Óptico de Marcas (OMR)

Reconhecimento óptico de códigos de barras (OBR)

Modos de reconhecimento

Reconhecimento de Texto Completo e em Nível de Campo

Idiomas do usuário

Treinamento de padrões

Veja também