Mostrar registro simples

dc.contributor.advisorGalante, Renata de Matospt_BR
dc.contributor.authorReinaldo, Jessica Tais de Souzapt_BR
dc.date.accessioned2018-04-26T02:32:55Zpt_BR
dc.date.issued2018pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/175038pt_BR
dc.description.abstractAnHALytics é um framework para mineração de dados de documentos técnicos e científicos oriundos de repositórios de grande porte. AnHALytics recupera, extrai dados importantes, e enriquece esses arquivos usando informação sobre o próprio artigo, além de outras bases de dados (por exemplo, a Wikipedia). O workflow de AnHALytics é executado de forma manual, o que causa alguns problemas relacionados com a falta de tolerância a falhas e de um fluxo de execução mais flexível, além da dificuldade para manter e garantir a reprodutibilidade científica. Para prover uma solução para esse problema, um estudo sobre os principais sistemas de workflow e como eles iriam se comportar com uma aplicação como AnHALytics foi realizado. No final desse estudo, um desses sistemas foi selecionado, e sobre ele foi executada uma simulação de performance em uma aplicação similar à AnHALytics, onde foi observado seu comportamento em comparação a uma solução por scripts. Os resultados dessa simulação mostraram que esse tipo de aplicação pode ser significantemente melhorado com a integração de workflows científicos. Como os resultados da simulação mostraram, workflows científicos — criados inicialmente para aplicações no domínio das biociências — também podem ser utilizados em aplicações de mineração de dados, e apresentam resultados similares, dando à aplicação significantes melhoras quando comparado com a versão em script, manualmente executada, do workflow.pt_BR
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectBanco de dadospt_BR
dc.titleAnHALytics : a workflow for text miningpt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coAzhar, Achrafpt_BR
dc.contributor.advisor-coChassignol, Didierpt_BR
dc.identifier.nrb001065168pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2018pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples