Variantes de tipo de documento
- Para centenas de variantes, skills treinadas usando Online Learning no Vantage conseguirão extrair dados quase sem erros.
- Para milhares de variantes, skills treinadas usando a atividade Deep Learning conseguirão extrair dados com uma precisão de aproximadamente 80% a 90%, dependendo da complexidade dos tipos de documento.
- Para as variantes mais importantes de um tipo de documento, skills treinadas usando as atividades Fast Learning e/ou Extraction Rules garantirão uma extração precisa de dados de documentos complexos.
- Para documentos estruturados, que sempre têm o mesmo tipo de informação exatamente nos mesmos locais, recomendamos usar até 10 variantes. Se um formulário fixo tiver muitas variantes, recomendamos tratá-las todas como tipos de documento diferentes.
- Ao treinar uma skill, use um conjunto de documentos representativo contendo pelo menos 2 a 3 documentos de cada variante. Se houver muitas variantes e o conjunto não contiver pelo menos um documento de cada variante, você poderá usar a atividade Deep Learning. Ela entende padrões de imagem, a estrutura espacial dos documentos, conteúdos de campos e rótulos ao redor e pode processar variantes que não foram usadas no treinamento.
- Ao testar uma skill, use uma distribuição de documentos semelhante à do fluxo real de documentos em produção: a porcentagem de documentos de uma variante específica no conjunto de treinamento deve ser representativa da frequência com que a variante aparece no seu fluxo de documentos. Isso garantirá que a estimativa de precisão seja válida. Para isso, teste skills usando uma amostra aleatória de documentos do fluxo real de documentos em produção.
- Ter uma amostra de variante é melhor do que não ter nenhuma.
