O DHBB como corpo linguístico

Nesta página apresenta-se o DHBB como corpo linguístico, acessível através do AC/DC.

Levantamento do recurso

Além de ser acessível através da interface do AC/DC, aqui, também se pode obter o corpo no formato AC/DC, com uma unidade por linha:

Perguntas já respondidas

Aqui pode consultar uma lista de perguntas já respondidas, desenvolvida por Suemi Higuchi, e que poderá ser atualizada com base em futuras perguntas que recebamos: Perguntas já respondidas, versão 1.0.

Quantificação da identificação dos nomes próprios

O processo de identificar qual a pessoa referida por um dado nome próprio, que designamos por "identificação" aqui (e que referimos por "grounding" em inglês) é feito de uma forma iterativa, baseada em regras, que preenchem o atributo entidade.

Na tabela que se segue apresentamos o material já tratado:

Número de palavras pertencentes a nomes próprios humanosIdentificadosVersão do corpo
404.24589.937 1.0
404.245147.085 1.1
404.243166.059 1.2
478.333239.106 2.0-2.3


Última atualização: 9 de fevereiro de 2019.