AnHALytics : a workflow for text mining
dc.contributor.advisor | Galante, Renata de Matos | pt_BR |
dc.contributor.author | Reinaldo, Jessica Tais de Souza | pt_BR |
dc.date.accessioned | 2018-04-26T02:32:55Z | pt_BR |
dc.date.issued | 2018 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/175038 | pt_BR |
dc.description.abstract | AnHALytics é um framework para mineração de dados de documentos técnicos e científicos oriundos de repositórios de grande porte. AnHALytics recupera, extrai dados importantes, e enriquece esses arquivos usando informação sobre o próprio artigo, além de outras bases de dados (por exemplo, a Wikipedia). O workflow de AnHALytics é executado de forma manual, o que causa alguns problemas relacionados com a falta de tolerância a falhas e de um fluxo de execução mais flexível, além da dificuldade para manter e garantir a reprodutibilidade científica. Para prover uma solução para esse problema, um estudo sobre os principais sistemas de workflow e como eles iriam se comportar com uma aplicação como AnHALytics foi realizado. No final desse estudo, um desses sistemas foi selecionado, e sobre ele foi executada uma simulação de performance em uma aplicação similar à AnHALytics, onde foi observado seu comportamento em comparação a uma solução por scripts. Os resultados dessa simulação mostraram que esse tipo de aplicação pode ser significantemente melhorado com a integração de workflows científicos. Como os resultados da simulação mostraram, workflows científicos — criados inicialmente para aplicações no domínio das biociências — também podem ser utilizados em aplicações de mineração de dados, e apresentam resultados similares, dando à aplicação significantes melhoras quando comparado com a versão em script, manualmente executada, do workflow. | pt_BR |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Banco de dados | pt_BR |
dc.title | AnHALytics : a workflow for text mining | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisor-co | Azhar, Achraf | pt_BR |
dc.contributor.advisor-co | Chassignol, Didier | pt_BR |
dc.identifier.nrb | 001065168 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2018 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License