Repositório Digital

A- A A+

Aplicação do MapReduce na análise de mutações gênicas de pacientes

.

Aplicação do MapReduce na análise de mutações gênicas de pacientes

Mostrar registro completo

Estatísticas

Título Aplicação do MapReduce na análise de mutações gênicas de pacientes
Outro título Application of mapreduce in the analysis of genetic mutations in patients
Autor Reckziegel Filho, Bruno
Orientador Geyer, Claudio Fernando Resin
Data 2013
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Assunto Informática médica
Processamento paralelo
[en] Bioinformatics
[en] Data-intensive computing
[en] MapReduce
[en] Medical genetics analysis
Resumo O avanço obtido com o desenvolvimento de técnicas rápidas para o sequenciamento de DNA e a comercialização de máquinas sequenciadoras, permitiram vários progressos na área da genética médica. Porém, devido à grande quantia de dados produzidos por tais máquinas, métodos e programas que façam a análise de sequenciamento eficientemente e em um curto espaço de tempo são indispensáveis. Além disso, aplicações que façam o diagnóstico clínico de pacientes são vistas com extremo interese por parte de pesquisadores e médicos. O MapReduce é um modelo de computação intensiva em dados que possibilita o tratamento de dados intensivos em um sistema de arquivos distribuído, além de abstrair o paralelismo de tarefas, através do uso de duas funções básicas (Map e Reduce), e permitir o controle de falhas. Considerando a inexistência de dependência entre tais dados, arquivos longos de todos tipos são bem aceitos para serem analisados neste contexto, sendo desmembrados em tamanhos menores e manipulados por diversas máquinas. Portanto, o uso desse modelo acaba se tornando uma possível solução viável para o propósito de análise dos dados produzidos por sequenciadores. Considerando tais fatos, este trabalho de conclusão de graduação objetivou o desenvolvimento de um aplicativo MR , em conjunto com pesquisadores do Grupo de Processamento Paralelo e Distribuído (GPPD) da Universidade Federal do Rio Grande do Sul e pesquisadores do Hospital de Clínica de Porto Alegre (HCPA), que auxilie no diagnóstico clínico de pacientes através da automatização da análise das sequências genéticas desses pacientes (providas por máquinas sequenciadoras) e que vise a criação de uma solução escalável, considerando esse grande volume de dados a ser analisado.
Abstract The advance obtained with the development of fast DNA sequencing techniques and the commercialization of sequencing machines allowed the progress of many researches in the Medical Genetics area. However, due to the big quantity of data produced by these machines, the development of methods and programs that can analyse these data efficiently and rapidly is required. Besides, diagnosis applications are viewed with extreme interest by doctors and researchers. MapReduce is a data-intensive computing model that handles big volume of data in a distributed file system, abstracting the parallelism of tasks over these data using two basic functions (Map and Reduce) and creating a fault-tolerant system. It provides support for Big files from all types of formats, dividing these files in small pieces and distributing them to the machines being used by the architecture. Therefore, this computing model can offer a good solution to the analysis of the data volume generated by sequencing machines. Considering these facts, the objective in this bachelor work is to develop an MR application(supported by GPPD and HCPA researchers) to assist in the clinic diagnosis of patients automatizing the analysis of the genetic sequences from these patients (provided by sequencing machines) and trying to create a scalable solution considering the great amount of data to be analyzed.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/77306
Arquivos Descrição Formato
000896370.pdf (1.080Mb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.