La actividad de Segmentation está diseñada para dividir el texto de documentos no estructurados en párrafos. Esto permite que el programa acote las regiones de búsqueda de los campos que deben extraerse mediante otras actividades. La actividad también puede usarse para extraer párrafos completos en campos de texto (por ejemplo, si desea extraer cláusulas y condiciones legales de un contrato).Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Imagen de ejemplo de un párrafo típico
Imagen de ejemplo de un párrafo típico

Casos de uso
- Cuando sabe que las entidades nombradas que desea extraer de los documentos siempre se encuentran en el mismo párrafo. Por ejemplo, si sabe que los nombres de organizaciones y las direcciones que necesita extraer se encuentran en el primer párrafo de cada contrato, puede extraer el primer párrafo usando una actividad de Segmentation y luego extraer nombres de empresas y direcciones de ese párrafo usando una actividad de Named Entities (NER). Este enfoque es más fiable que extraer entidades nombradas de todo el documento, ya que puede controlar el área específica de la que se extraen dichas entidades.
- Cuando sea necesario extraer un párrafo en su totalidad porque todo su contenido es valioso; por ejemplo, un párrafo que contenga las condiciones de pago de un contrato.
Cómo funciona
- Para documentos con alta variabilidad, se requieren al menos 100 documentos de ejemplo.
- Para documentos con baja variabilidad, se requieren al menos 20 documentos de ejemplo.
