Repositório Digital

A- A A+

Análise de dados de altas dimensões

.

Análise de dados de altas dimensões

Mostrar registro completo

Estatísticas

Título Análise de dados de altas dimensões
Autor Beuren, Gilberto Müller
Orientador Fachel, Jandyra Maria Guimarães
Data 2010
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Curso de Estatística: Bacharelado.
Assunto Análise de similaridade genética
Estatistica aplicada : Medicina
[en] Bidimensional electrophoresis
[en] DNA sequences
[en] High dimensional data
[en] Image comparison
Resumo O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões.
Abstract Technological progress is enabling new science areas to develop and, thus, new techniques are beginning to emerge. Problems previously considered unsolvable now have a computational solution. And this is not different in statistics. Increasing databases has emerged and, with this, high dimensional data arise. Areas such as chemistry, genetics and life sciences have an increasing interest in analyzing this kind of data. The current multivariate techniques do not apply in this case and, therefore, new methods must be developed. This monograph has as its main focus to review the existing literature on the topic of high dimensional data. It is shown techniques such as similarity analysis, dimensionality reduction, cluster analysis and measures of distance between DNA sequences. We present the software ImageMaster™ 2D Platinum, which is a viable alternative to the analysis of similarity between images and the software PAST and, finally, three examples illustrate the use of the methods with high dimensional data.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/24864
Arquivos Descrição Formato
000749628.pdf (3.335Mb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.