Work stealing inside GPUs

Toss, Julio

dc.contributor.advisor	Maillard, Nicolas Bruno	pt_BR
dc.contributor.author	Toss, Julio	pt_BR
dc.date.accessioned	2012-01-26T01:19:50Z	pt_BR
dc.date.issued	2011	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/36890	pt_BR
dc.description.abstract	Unidades de processamento gráfico (GPU) tornaram-se ferramentas de grande valia no domínio da computação de alto desempenho. Graças as recentes inovações e melhoramentos do hardware é possível utilizar processadores gráficos de propósito genéricos (GPGPUS) em uma ampla gama de aplicações científicas. No entanto, os modelos de programação existentes usados em GPGPU não são ainda suficientemente adaptáveis `as diversas formas de paralelismo que uma aplicação possa expressar. Neste contexto, propomos um modelo híbrido de programação paralela para GPGPU usando paralelismo de tarefas e de dados. Em oposição ao que e advogado pelo modelo de programação CUDA, baseado apenas no paralelismo de dados, mostramos que ´e possível explorar o paralelismo de tarefas em GPUs e escaloná-las de forma eficiente usando a técnica do roubo de tarefas. Apresentamos neste trabalho a implementação de um escalonador por roubo de tarefas em CUDA e comparamos seu desempenho aos métodos de escalonamento estático e por lisa aplicados aos problemas de transformação em array e particionamento em octree.	pt_BR
dc.description.abstract	Graphics Processing units have become a valuable support for High Performance Computing (HPC) applications. However, despite the many improvements on the General Purpose GPU, there is still the need of a generic programming model adaptable to the many forms of parallelism that an application can express. The CUDA programming model is widely used on the GPGPU domain, but is very limited in aspects like load balancing and task parallelism. This work introduces a new programming model to be used on general purpose graphics processors. We propose an hybrid model combining tasks and data parallelism which extends the domain of applications that can efficiently make use of graphics processors. We implement a work stealing scheduler to efficiently schedule tasks inside a GPU keeping an even load balance between its multiprocessors. Finally, we evaluate the performance of our work stealing scheduler comparing it with static and list scheduling methods applied to the problems of array transformation and octree partitioning.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Processamento paralelo	pt_BR
dc.subject	GPGPU	en
dc.subject	Mpi	pt_BR
dc.subject	Scheduling	en
dc.subject	Dynamic load balancing	en
dc.subject	Work stealing	en
dc.subject	Array transform	en
dc.title	Work stealing inside GPUs	pt_BR
dc.title.alternative	Roubo de trabalho em processadores gráficos	pt
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.contributor.advisor-co	Gautier, Thierry	pt_BR
dc.identifier.nrb	000819140	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2011	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 000819140.pdf
Tamanho:: 484.8Kb
Formato:: PDF
Descrição:: Texto completo (inglês)

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (35860)

TCC Ciência da Computação (992)

Mostrar registro simples