Mostrar registro simples

dc.contributor.authorOthero, Gabriel de Ávilapt_BR
dc.contributor.authorAyres, Mônica Rigopt_BR
dc.date.accessioned2015-05-26T02:00:59Zpt_BR
dc.date.issued2014pt_BR
dc.identifier.issn1983-3652pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/117105pt_BR
dc.description.abstractApresentamos, neste artigo, nosso trabalho de anotação morfológica automática de trechos de um corpus de língua falada – pertencentes ao projeto Varsul –, utilizando um etiquetador automático morfossintático gratuito, o Aelius, em 20 textos, perfazendo um total de 154.530 palavras. Basicamente, apresentamos a ferramenta de anotação automática, o processo de análise morfossintática automática efetuada pelo anotador, o trabalho de revisão manual da etiquetagem automática e as sugestões de melhorias para tratar especificamente de aspectos da oralidade. A partir dos erros do etiquetador, buscamos depreender certos padrões de anotação para superar limitações de desempenho apresentadas pelo programa, propondo algumas sugestões de implementações para que o Aelius etiquete de maneira ainda mais satisfatória um corpus de língua falada. Tratamos especialmente dos casos de interjeições, aféreses, onomatopeias e marcadores conversacionais.pt_BR
dc.description.abstractIn this paper, we present the results of our work on automatic morphological annotation using the free morphosyntatic Aelius tagger. The excerpts analyzed were taken from a corpus of spoken language – part of the VARSUL project. We present 20 texts containing 154,530 words, which were automatically annotated and manually corrected. This paper also describes the Aelius tagger and our effort of manual reviewing the texts, as well as our suggestions for improving the tool, concerning aspects of oral texts tagging. We assessed the performance of the tagger at the morphosyntactic tagging of a spoken language corpus, an unprecedented challenge for the tool. Based on its errors, we try to infer certain patterns of annotation to overcome the limitations presented by the program. We also make suggestions in order to allow Aelius to tag spoken language corpora in a more effective way, specially when dealing with interjections, apheresis, onomatopoeia and conversational markers.en
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.relation.ispartofTexto livre. Belo Horizonte, MG. Vol. 7, n. 2 (primavera 2014), f. 44-60pt_BR
dc.rightsOpen Accessen
dc.subjectAeliuspt_BR
dc.subjectTaggeren
dc.subjectLingüística de corpuspt_BR
dc.subjectMorphosyntactic taggingen
dc.subjectCorpus Linguisticsen
dc.subjectMorfossintaxept_BR
dc.titleAnotação morfológica automática de corpus de língua falada : desafios ao Aeliuspt_BR
dc.title.alternativeMorphological pos tagging in oral language corpus : challenges for Aeliusen
dc.typeArtigo de periódicopt_BR
dc.identifier.nrb000966630pt_BR
dc.type.originNacionalpt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples