Pular para o conteúdo principal
Este tópico se aplica ao FRE for Windows, mas não requer Visual Components.
Se a propriedade IRecognizerParams::TrainUserPatterns estiver definida como TRUE, o modo Train User Pattern será usado durante o reconhecimento. Sempre que um caractere desconhecido for encontrado, a caixa de diálogo Pattern Training será aberta, com a imagem do caractere exibida. PatternTrainingDialog
Você também pode usar o método IEngine::TrainUserPattern para fazer o treinamento de padrões sem exibir a caixa de diálogo. Esse método recebe como parâmetros de entrada o objeto TrainingImagesCollection, que armazena uma coleção de imagens de caracteres, e o próprio caractere.

Treinamento para reconhecer um caractere

A moldura na janela de diálogo superior deve envolver um único caractere, e esse caractere deve estar totalmente contido nela. Se a moldura envolver apenas parte do caractere ou mais de um caractere, clique nas bordas da moldura e mova-as até que os requisitos acima sejam atendidos. Os botões MoveBodyLeft e MoveBodyRight também movem a borda da moldura (e são úteis para treinar símbolos em itálico). Depois de posicionar a moldura corretamente, digite o caractere e clique no botão Train.
  • Você só pode treinar o sistema para ler caracteres incluídos no alfabeto. Se quiser treinar o ABBYY FineReader Engine para ler caracteres que não podem ser inseridos pelo teclado, use uma combinação de dois caracteres para representar esses caracteres inexistentes ou copie o caractere necessário da Tabela de caracteres (clique no botão DotButton na caixa de diálogo Pattern Training para abrir a Tabela de caracteres).
  • Se quiser treinar o sistema para preservar a formatação dos caracteres, selecione o item correspondente, Italic ou Bold, na caixa de diálogo Pattern Training antes de clicar no botão Train.
  • Certifique-se de inserir apenas caracteres maiúsculos/minúsculos ao treinar imagens de caracteres maiúsculos/minúsculos, respectivamente.
Se você cometer um erro durante o treinamento, clique no botão Back para retornar a moldura à posição anterior. O último par “imagem — caractere” inserido será removido automaticamente do padrão. Observe que essa função de “desfazer” se limita à última palavra treinada.

Treinamento para reconhecer ligaturas

Uma ligatura é uma combinação de dois ou três caracteres “unidos”, por exemplo, fi, fl, ffi. Esses caracteres são difíceis de separar porque ficam “unidos” como parte do processo de impressão. Na verdade, é possível obter melhores resultados tratando-os como caracteres compostos “únicos”. Treinar ligaturas não é diferente de treinar caracteres separados:
  1. Digite a combinação de caracteres necessária e clique no botão Train.
  2. A moldura na caixa de diálogo superior deve abranger toda a ligatura. Você pode mover a borda da moldura usando o mouse ou clicando nos botões MoveBodyLeft e MoveBodyRight.
Cada padrão pode conter até 1000 caracteres novos. No entanto, você não deve criar muitas ligaturas, pois isso pode afetar negativamente a qualidade do reconhecimento.

Limitações do treinamento

Você também deve levar em conta as seguintes limitações ao treinar o ABBYY FineReader Engine:
  • O ABBYY FineReader Engine não diferencia determinados caracteres que normalmente são considerados distintos. Essas imagens são reconhecidas como um único caractere. Por exemplo, os apóstrofos reto (’), direito (’) e esquerdo (‘) são mantidos no Pattern Training como um único caractere — o apóstrofo reto. Portanto, você nunca verá os apóstrofos direito e esquerdo no texto reconhecido, mesmo que tente treiná-los.
  • Em alguns casos, uma determinada imagem é reconhecida como um determinado caractere dependendo do contexto em que aparece.
  • O Pattern Training não tem suporte para idiomas CJK.

Veja também

Reconhecimento usando treinamento RecognizerParams