Repositório Digital

A- A A+

Desenvolvimento de um recurso léxico com papéis semânticos para o português

.

Desenvolvimento de um recurso léxico com papéis semânticos para o português

Mostrar registro completo

Estatísticas

Título Desenvolvimento de um recurso léxico com papéis semânticos para o português
Outro título Developing a lexical resource annotated with semantic roles for Portuguese
Autor Zilio, Leonardo
Ramisch, Carlos Eduardo
Finatto, Maria José Bocorny
Resumo Os objetivos deste estudo são os seguintes: apresentar uma metodologia para desenvolver um recurso léxico com informações semânticas; comparar papéis semânticos de verbos em linguagem especializada e não especializada; e observar a anotação de papéis semânticos por vários anotadores. Foram desenvolvidos dois experimentos relacionados à anotação de papéis semânticos em português: comparação de um corpus de linguagem especializada com um corpus de linguagem não especializada; e teste da concordância entre diversos anotadores na atribuição de papéis semânticos. Quanto aos resultados, observaram-se diferenças qualitativas entre os corpora estudados, sendo o apagamento de agentes um traço marcante do corpus especializado. A não concordância averiguada entre vários anotadores indica que a tarefa é complexa, requerendo mais treinamento ou uma maior simplificação da tarefa, o que não parece ser possível no atual estágio de desenvolvimento.
Abstract The objectives of this study are as follows: to present a methodology for the development of a lexical resource with semantic information; to compare semantic roles in specialized and nonspecialized language; and to observe the semantic role labeling (SRL) made by a group of annotators. Two experiments revolving around SRL in Portuguese were developed: a comparison between data in specialized and non-specialized language corpora; and an annotation evaluation for verifying the agreement among multiple annotators for the task of SRL. As for results, a qualitative difference between the corpora was observed, and the most prominent feature was the omission of agents in specialized texts. There was little agreement among annotators, which points toward the necessity of more training, or a simplification of the task, which does not seem to be possible at this stage of development.
Contido em Linguamática. Portugal. Vol. 5, n. 2 (dez. 2013), p. [23]-41
Assunto Linguagem natural : Processamento de textos
Lingüística computacional
Lingüística de corpus
[en] Computacional linguistics
[en] Lexical resources
[en] Natural language processing
[en] Semantic role labeling
Origem Estrangeiro
Tipo Artigo de periódico
URI http://hdl.handle.net/10183/167279
Arquivos Descrição Formato
001047599.pdf (1.184Mb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.