Repositório Digital

A- A A+

Text Mining utilizando o Software R : um estudo de caso de uma biblioteca americana

.

Text Mining utilizando o Software R : um estudo de caso de uma biblioteca americana

Mostrar registro completo

Estatísticas

Título Text Mining utilizando o Software R : um estudo de caso de uma biblioteca americana
Autor Staudt Junior, Jorge Luiz
Orientador Selau, Lisiane Priscila Roldão
Data 2016
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Departamento de Estatística. Curso de Estatística: Bacharelado.
Assunto Análise de dados
Redes sociais
Software estatistico
Resumo A quantidade de dados textuais existente na rede de computadores é enorme, pois muitas pessoas e empresas usam a internet diariamente para expressarem suas opiniões sobre diversos assuntos. Esses dados textuais podem conter informações valiosas, que muitas vezes, podem ser obtidas com rapidez e baixo custo financeiro, como a informação obtida nas redes sociais. Nas redes sociais são estimadas milhares de postagens de escrita e fotos por segundo. Sendo assim, o domínio de técnicas para extrair informações de bases textuais sem necessidade de leitura prévia é de grande relevância. Tendo em vista a busca de informações pertinentes e relevantes, um programa de leitura da biblioteca da cidade de Chicago, decidiu usar a técnica de Text Mining para extrair essas informações na rede social Twitter, em busca de ideias para aperfeiçoamento e continuidade do programa. Hoje em dia, há diversos softwares pagos e gratuitos que contém a técnica do Text Mining. Dessa maneira, o objetivo desse trabalho é estudar o processo de Text Mining desde a obtenção até a análise dos dados e seu uso no Software R, além de mostrar sua aplicação para ajudar o programa de leitura de Chicago a obter as informações para tomada de decisões. Com o Software R, foram coletados tweets sobre o programa de leitura da biblioteca de Chicago. Inicialmente, esses dados foram devidamente preparados para análise, depois foram construídos gráficos de frequências e nuvem de palavras. Para dividir os tweets por assunto foram utilizadas três diferentes técnicas de Clustering e modelagem por tópicos. Com a limpeza e análise dos tweets foi possível obter uma ideia dos diversos assuntos que as pessoas estavam falando no Twitter sobre o programa de leitura.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/149102
Arquivos Descrição Formato
001004730.pdf (871.3Kb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.