Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética

Levin, Felipe Hoppe

dc.contributor.advisor	Heuser, Carlos Alberto	pt_BR
dc.contributor.author	Levin, Felipe Hoppe	pt_BR
dc.date.accessioned	2010-12-16T04:19:20Z	pt_BR
dc.date.issued	2010	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/26968	pt_BR
dc.description.abstract	Bibliotecas digitais tornaram-se uma importante fonte de informação para comunidades científicas. Entretanto, por coletar dados de diferentes fontes, surge o problema de informações ambíguas ou duplicadas de nomes de autores. Métodos tradicionais de desambiguação de nomes utilizam informação sintática de atributos. Todavia, recentemente o uso de redes de relacionamentos, que traz informação semântica, tem sido estudado em desambiguação de dados. Em desambiguação de nomes de autores, relações de co-autoria podem ser usadas para criar uma rede social, que pode ser utilizada para melhorar métodos de desambiguação de nomes de autores. Esta dissertação apresenta um estudo do impacto de adicionar análise de redes sociais a métodos de desambiguação de nomes de autores baseados em informação sintática de atributos. Nós apresentamos uma abordagem de aprendizagem de máquina baseada em Programação Genética e a utilizamos para avaliar o impacto de adicionar análise de redes sociais a desambiguação de nomes de autores. Através de experimentos usando subconjuntos de bibliotecas digitais reais, nós demonstramos que o uso de análise de redes sociais melhora de forma significativa a qualidade dos resultados. Adicionalmente, nós demonstramos que as funções de casamento criadas por nossa abordagem baseada em Programação Genética são capazes de competir com métodos do estado da arte.	pt_BR
dc.description.abstract	Digital libraries have become an important source of information for scientific communities. However, by gathering data from different sources, the problem of duplicate and ambiguous information about author names arises. Traditional methods of name disambiguation use syntactic attribute information. However, recently the use of relationship networks, which provides semantic information, has been studied in data disambiguation. In author name disambiguation, the co-authorship relations can be used to create a social network, which can be used to improve author name disambiguation methods. This dissertation presents a study of the impact of adding social network analysis to author name disambiguation methods based on syntactic attribute information. We present a machine learning approach based on Genetic Programming and use it to evaluate the impact of social network analysis in author name disambiguation. Through experiments using subsets of real digital libraries, we show that the use of social network analysis significantly improves the quality of results. Also, we demonstrate that match functions created by our Genetic Programming approach are able to compete with state-of-the-art methods.	en
dc.format.mimetype	application/pdf
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Name disambiguation	en
dc.subject	Banco : Dados	pt_BR
dc.subject	Agentes sociais	pt_BR
dc.subject	Relationship analysis	en
dc.subject	Social networks	en
dc.subject	Genetic programming	en
dc.subject	Match functions	en
dc.subject	Digital libraries	en
dc.title	Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética	pt_BR
dc.title.alternative	Author name disambiguation in digital libraries using social networks and genetic programming	en
dc.type	Dissertação	pt_BR
dc.identifier.nrb	000762203	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Computação	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2010	pt_BR
dc.degree.level	mestrado	pt_BR

Nome:: 000762203.pdf
Tamanho:: 875.2Kb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Ciências Exatas e da Terra (5040)

Computação (1733)

Mostrar registro simples