Digital Repository

A- A A+

Abordagem baseada em conceitos para descoberta de conhecimento em textos

DSpace/Manakin Repository

Abordagem baseada em conceitos para descoberta de conhecimento em textos

Show full item record

Statistics

Title Abordagem baseada em conceitos para descoberta de conhecimento em textos
Author Loh, Stanley
Advisor Oliveira, Jose Palazzo Moreira de
Date 2001
Level Doctorate
Institution Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.
Subject Armazenamento : Dados
Descoberta : Conhecimento
Mineracao : Dados
Recuperacao : Informacao
Abstract in Portuguese Esta tese apresenta uma abordagem baseada em conceitos para realizar descoberta de conhecimento em textos (KDT). A proposta é identificar características de alto nível em textos na forma de conceitos, para depois realizar a mineração de padrões sobre estes conceitos. Ao invés de aplicar técnicas de mineração sobre palavras ou dados estruturados extraídos de textos, a abordagem explora conceitos identificados nos textos. A idéia é analisar o conhecimento codificado em textos num nível acima das palavras, ou seja, não analisando somente os termos e expressões presentes nos textos, mas seu significado em relação aos fenômenos da realidade (pessoas, objetos, entidades, eventos e situações do mundo real). Conceitos identificam melhor o conteúdo dos textos e servem melhor que palavras para representar os fenômenos. Assim, os conceitos agem como recursos meta-lingüísticos para análise de textos e descoberta de conhecimento. Por exemplo, no caso de textos de psiquiatria, os conceitos permitiram investigar características importantes dos pacientes, tais como sintomas, sinais e comportamentos. Isto permite explorar o conhecimento disponível em textos num nível mais próximo da realidade, minimizando o problema do vocabulário e facilitando o processo de aquisição de conhecimento. O principal objetivo desta tese é demonstrar a adequação de uma abordagem baseada em conceitos para descobrir conhecimento em textos e confirmar a hipótese de que este tipo de abordagem tem vantagens sobre abordagens baseadas em palavras. Para tanto, foram definidas estratégias para identificação dos conceitos nos textos e para mineração de padrões sobre estes conceitos. Diferentes métodos foram avaliados para estes dois processos. Ferramentas automatizadas foram empregadas para aplicar a abordagem proposta em estudos de casos. Diferentes experimentos foram realizados para demonstrar que a abordagem é viável e apresenta vantagens sobre os métodos baseados em palavras. Avaliações objetivas e subjetivas foram conduzidas para confirmar que o conhecimento descoberto era de qualidade. Também foi investigada a possibilidade de se realizar descobertas proativas, quando não se tem hipóteses iniciais. Os casos estudados apontam as várias aplicações práticas desta abordagem. Pode-se concluir que a principal aplicação da abordagem é permitir análises qualitativa e quantitativa de coleções textuais. Conceitos podem ser identificados nos textos e suas distribuições e relações podem ser analisadas para um melhor entendimento do conteúdo presente nos textos e, conseqüentemente, um melhor entendimento do conhecimento do domínio.
Type Thesis
URI http://hdl.handle.net/10183/1849
Files Description Format View
000360024.pdf (744.3Kb) Texto completo Adobe PDF View/Open

This item is licensed under a Creative Commons License

This item appears in the following Collection(s)


Show full item record

Browse



  • The author is the owner of the copyrights of the documents available in this repository and is prohibited under the law, the marketing of any kind without prior authorization.
    Graphic design by Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.