Vai al contenuto principale
L’attività Entità denominate (NER) è progettata per utilizzare l’elaborazione del linguaggio naturale (NLP) per estrarre entità denominate da documenti non strutturati, come contratti, lettere, ordini, comunicati stampa e altri documenti privi di una struttura specifica descrivibile tramite regole. Per elaborare questi documenti con un’attività Entità denominate (NER), è necessario mappare le entità denominate ai field della skill nei quali verranno estratti i relativi valori. Questa attività analizzerà quindi il documento ed estrarrà le entità denominate nei rispettivi field. È inoltre possibile configurare l’estrazione di entità denominate per i field estratti da altre attività. Supponiamo di sapere che i nomi delle organizzazioni e gli indirizzi da estrarre si trovano nel primo paragrafo di ciascun contratto. È possibile estrarre il primo paragrafo utilizzando un’attività Segmentation, quindi estrarre i nomi delle aziende e gli indirizzi da questo paragrafo con un’attività Entità denominate (NER). Questo approccio è più affidabile rispetto all’estrazione di entità denominate dall’intero documento, poiché consente di controllare l’area specifica da cui vengono estratte tali entità.
Nota: L’attività supporta solo field di tipo Testo che hanno il tipo di dati impostato su Testo, Data o Denaro.

Configurazione di un’attività Named Entities (NER)

Per configurare un’attività Named Entities (NER):
  1. Nella scheda Activities, aggiungere un’attività Named Entities (NER) al flusso di elaborazione dei documenti.
  2. Nel riquadro Activity Properties, utilizzare l’elenco a discesa Source per selezionare l’origine che l’attività utilizzerà per estrarre le entità denominate: l’intero documento oppure un singolo field estratto da un’altra attività.
  3. In Output field, selezionare i field in cui verranno estratte le entità denominate.
Nota: I field di output devono trovarsi allo stesso livello di annidamento del field di origine o a un livello inferiore.
  1. Fare clic su Create Mapping. Nella finestra di dialogo che si aprirà, selezionare quali entità denominate verranno estratte in ciascun field nell’elenco Entity to extract. Fare clic su Save. È possibile modificare il mapping in qualsiasi momento facendo clic su Edit Mapping.
  2. Fare clic su Test Skill per testare la skill e analizzare i risultati dell’estrazione delle entità denominate nella scheda Results.

Entità denominate supportate

Nome entitàDescrizioneEsempioTipi di dati supportatiLingue supportate
PersonNomi di personeJohn Doe, Jane SmithTestoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
LocationNomi di localitàAnytown, Corporate PlaceTestoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrganizationNomi di organizzazioniABBYY, Acme Corp.TestoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
AddressIndirizzi123 Main St., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATestoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
MoneyImporti di denaro$2670.00, 199 dollars 99 centsTesto, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DateDateNovember 14, 2009, 11/14/2009Testo, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DurationDurateTwelve (12) months, 4 daysTestoEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch