Named entity recognition (NER)

Named entity recognition (NER) é uma sub-tarefa de extração de informação (IE) que busca e categoriza entidades especificadas em um corpo ou corpos de textos. O NER é também conhecido simplesmente como identificação de entidades, agrupamento de entidades e extracção de entidades. NER is usado em muitos campos em inteligência artificial (IA) incluindo processamento de linguagem natural (PNL) e aprendizagem de máquina.

Exploração de informação depende do NER para encontrar informação direccionada, utilizando modelos que funcionam com base em modelos gramaticais ou estatísticos. O TNR reconhece as entidades primeiro como uma das várias categorias, tais como pessoas, locais, organizações, expressões, percentagens e valores monetários. As categorias são abreviadas: localização (LOC), pessoas (PER) e organizações (ORG), etc. Uma vez que a categoria de informação é reconhecida, um utilitário de extração de informação extrai a informação relacionada à entidade nomeada e constrói um documento legível por máquina a partir dela que outras ferramentas podem processar para extrair o significado.

Como com muitas tarefas difíceis na IA, os desafios NER são apresentados à comunidade de desenvolvimento para incentivar o desenvolvimento de soluções. A Conferência de Compreensão da Mensagem (MUC) é um desses desafios. Comparavelmente, os humanos tiveram uma pontuação de 97,60% e 96,95% precisão enquanto o melhor sistema IE teve uma pontuação de 93,39%.