Saltar al contenido principal
La actividad de Entidades Nombradas (NER) está diseñada para usar procesamiento de lenguaje natural (NLP) para extraer entidades nombradas de documentos no estructurados, como contratos, cartas, pedidos, comunicados de prensa y otros documentos sin una estructura específica que pueda describirse mediante reglas. Para procesar estos documentos con una actividad de Entidades Nombradas (NER), debe asignar las entidades nombradas a los campos de la skill en los que se extraerán los valores de las entidades. Luego, esta actividad analizará el documento y extraerá las entidades nombradas en sus campos correspondientes. También puede configurar la extracción de entidades nombradas para campos extraídos por otras actividades. Suponga que sabe que los nombres de organizaciones y las direcciones que necesita extraer se encuentran en el primer párrafo de cada contrato. Puede extraer el primer párrafo con una actividad de Segmentation y luego extraer los nombres de empresas y las direcciones de ese párrafo con una actividad de Entidades Nombradas (NER). Este enfoque es más confiable que extraer entidades nombradas de todo el documento, ya que puede controlar el área específica de la que se extraen dichas entidades.
Nota: La actividad solo admite campos de tipo Text que tengan el tipo de datos configurado como Text, Date o Money.

Configurar una actividad de Entidades con Nombre (NER)

Para configurar una actividad de Entidades con Nombre (NER):
  1. En la pestaña Activities, agregue una actividad de Entidades con Nombre (NER) al flujo de procesamiento de documentos.
  2. En el panel Activity Properties, use la lista desplegable Source para seleccionar el origen que la actividad utilizará para extraer las entidades con nombre: ya sea todo el documento o un campo individual extraído por otra actividad.
  3. En Output field, seleccione los campos en los que se extraerán las entidades con nombre.
Nota: Los campos de salida deben estar en el mismo nivel de anidación que el campo de origen o un nivel por debajo.
  1. Haga clic en Create Mapping. En el cuadro de diálogo que se abrirá, seleccione qué entidades con nombre se extraerán a cada campo en la lista Entity to extract. Haga clic en Save. Puede editar la asignación en cualquier momento haciendo clic en Edit Mapping.
  2. Haga clic en Test Skill para probar su Habilidad y analizar los resultados de extracción de entidades con nombre en la pestaña Results.

Entidades con nombre compatibles

Nombre de la entidadDescripciónEjemploTipos de datos compatiblesIdiomas compatibles
PersonNombres de personasJohn Doe, Jane SmithObjetoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
LocationNombres de ubicacionesAnytown, Corporate PlaceObjetoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrganizationNombres de organizacionesABBYY, Acme Corp.ObjetoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
AddressDirecciones123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USAObjetoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
MoneyMontos de dinero$2670.00, 199 dollars 99 centsObjeto, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DateFechasNovember 14, 2009, 11/14/2009Objeto, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DurationPeriodos de tiempoTwelve (12) months, 4 daysObjetoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch