dc.contributor.advisor | Beck Rutzig, Mateus | |
dc.creator | Vicenzi, Julio Costella | |
dc.date.accessioned | 2022-07-06T19:56:57Z | |
dc.date.available | 2022-07-06T19:56:57Z | |
dc.date.issued | 2021-01-05 | |
dc.date.submitted | 2021 | |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/25271 | |
dc.description | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa
Maria, Centro de Tecnologia, Curso de Engenharia de Computação, RS, 2021. | por |
dc.description.abstract | Cloud computing provides services of shared computational resources for the execution
of applications by tenants through computation offloading. To deal with the computational
load, the cloud’s nodes can integrate multi-core processing units with graphics processing
units. The system’s heterogeneity covers applications with massive instruction, thread and
data parallelism, which can be explored through the OpenCL programming model, leading
to reductions in the application’s execution time for the tenants and a reduction of energy
consumed to the cloud provider. This work proposes a framework for the execution of
OpenCL applications on a multi-tenant cloud environment composed of a CPU and a GPU,
scheduling the applications to the best device transparently, with the objective of best utilizing
the computing resources, reducing execution time and energy consumed. Five scheduling
algorithms are explored: First Come First Served, Weighted Round Robin, Max Min,
Min Min e First Fit. The execution of the PolyBench benchmark suite is used to evaluate
the performance of the framework in hardware configurations composed of an Intel Xeon
Haswell processor combined with an NVIDIA Tesla K20m, NVIDIA Tesla K80 or NVIDIA
GeForce 1080 Ti. For all of these configurations, First Fit is the highlighted algorithm, achieving
an average acceleration of 3,04 up to 3,80 times and an average energy reduction of
33% when compared to GPU exclusive execution. | eng |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Acesso Aberto | por |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | OpenCL | eng |
dc.subject | Computação em nuvem | por |
dc.subject | Sistemas heterogêneos | por |
dc.subject | Programação paralela | por |
dc.subject | Cloud computing | eng |
dc.subject | Heterogeneous systems | eng |
dc.subject | Parallel programming | eng |
dc.title | Exploração de múltiplos algoritmos de escalonamento de núcleos OpenCL para sistemas de processamento em nuvem multi-inquilino baseados em CPUS e GPUS | por |
dc.title.alternative | Exploration of multiple scheduling algorithms for OpenCL kernels on multi-tenant cloud systems based on CPUS and GPUS | eng |
dc.type | Trabalho de Conclusão de Curso de Graduação | por |
dc.degree.local | Santa Maria, RS, Brasil. | por |
dc.description.resumo | Computação em nuvem provê serviços de compartilhamento de recusos computacionais
para a execução de aplicações dos inquilinos atráves de computation offloading. Para lidar
com a carga computacional os nós da nuvem podem integrar unidades de processamento
multinúcleos com unidades de processamento gráfico. Esta heterogeneidade do sistema
abrange aplicações com massivo paralelismo ao nível de instruções, threads e dados, que
podem ser exploradas através do modelo de programação OpenCL, levando a diminuição
do tempo de execução das aplicações dos inquilinos e redução da energia consumida pelo
provedor de serviços. Este trabalho propõe um framework para a execução de aplicações
OpenCL em um ambiente de nuvem multi-inquilino formado por CPU e GPU, capaz de
escalonar e escolher o melhor dispositivo de maneira transparente, sem modificação do
código-fonte , com a finalidade de melhor utilizar os recursos computacionais, reduzir o
tempo de execução e energia. Cinco algoritmos de escalonamento são explorados: First
Come First Served, Weighted Round Robin, Max Min, Min Min e First Fit. A execução de
aplicações do conjunto de benchmarks Polybench é utilizado para a avaliação do desempenho
do framework em configurações de hardware formadas por um processador Intel
Xeon Haswell combinado a NVIDIA Tesla K20m, NVIDIA Tesla K80 ou NVIDIA GeForce
1080 Ti. Dentre todas as configurações, First Fit é o algoritmo que se destaca com aceleração
média de 3,04 até 3,80 vezes, com reduções de energia de 33% em média quando
comparado a execução exclusiva da GPU. | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFSM | por |
dc.subject.cnpq | CNPQ::ENGENHARIAS | por |
dc.publisher.unidade | Centro de Tecnologia | por |