Repositório Digital

A- A A+

Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações

.

Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações

Mostrar registro completo

Estatísticas

Título Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações
Outro título Assessing the impact of a stemming algorithm’s accuracy on information retrieval
Autor Flores, Felipe Nunes
Orientador Moreira, Viviane Pereira
Co-orientador Heuser, Carlos Alberto
Data 2009
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Assunto Recuperacao : Informacao
Stemmer
[en] Evaluation
[en] Information retrieval
[en] Paice’s method
[en] Stemming
Resumo A qualidade de um algoritmo de stemming é tipicamente medida de duas formas: (i) quão corretamente o algoritmo mapeia as diferentes formas de uma palavra para o mesmo stem; ou (ii) qual o nível de melhora que o algoritmo proporciona à Recuperação de Informações. O presente trabalho apresenta o desenvolvimento de uma ferramenta que implementa o método de Paice, o qual serve para avaliar os algoritmos de stemming de acordo com a primeira métrica mencionada acima. Além disso, diversos algoritmos de stemming para a língua portuguesa são avaliados de acordo com as duas métricas, a fim de verificar se os stemmers de maior qualidade são também aqueles que trazem o maior ganho para a Recuperação de Informações. Os resultados mostram que essa relação existe, porém ela não é tão forte quanto se poderia esperar.
Abstract The quality of a stemming algorithm is typically measured in two ways: (i) how accurately the algorithm maps the different forms of a word to the same stem; or (ii) the level of improvement that the algorithm provides to Information Retrieval. This paper presents a tool that implements Paice’s method, whose purpose is to evaluate stemming algorithms according to the first metric mentioned above. Besides, different Portuguese stemming algorithms are evaluated according to both metrics, in order to assess whether the most accurate stemmers are also the ones that bring the most gain to Information Retrieval. The results show that this relation does exist, but it is not as strong as one might have expected.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/18532
Arquivos Descrição Formato
000730582.pdf (414.9Kb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.