Mostrar registro simples

dc.contributor.advisorBeck Rutzig, Mateus
dc.creatorVicenzi, Julio Costella
dc.date.accessioned2022-07-06T19:56:57Z
dc.date.available2022-07-06T19:56:57Z
dc.date.issued2021-01-05
dc.date.submitted2021
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/25271
dc.descriptionTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Computação, RS, 2021.por
dc.description.abstractCloud computing provides services of shared computational resources for the execution of applications by tenants through computation offloading. To deal with the computational load, the cloud’s nodes can integrate multi-core processing units with graphics processing units. The system’s heterogeneity covers applications with massive instruction, thread and data parallelism, which can be explored through the OpenCL programming model, leading to reductions in the application’s execution time for the tenants and a reduction of energy consumed to the cloud provider. This work proposes a framework for the execution of OpenCL applications on a multi-tenant cloud environment composed of a CPU and a GPU, scheduling the applications to the best device transparently, with the objective of best utilizing the computing resources, reducing execution time and energy consumed. Five scheduling algorithms are explored: First Come First Served, Weighted Round Robin, Max Min, Min Min e First Fit. The execution of the PolyBench benchmark suite is used to evaluate the performance of the framework in hardware configurations composed of an Intel Xeon Haswell processor combined with an NVIDIA Tesla K20m, NVIDIA Tesla K80 or NVIDIA GeForce 1080 Ti. For all of these configurations, First Fit is the highlighted algorithm, achieving an average acceleration of 3,04 up to 3,80 times and an average energy reduction of 33% when compared to GPU exclusive execution.eng
dc.languageporpor
dc.publisherUniversidade Federal de Santa Mariapor
dc.rightsAcesso Abertopor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectOpenCLeng
dc.subjectComputação em nuvempor
dc.subjectSistemas heterogêneospor
dc.subjectProgramação paralelapor
dc.subjectCloud computingeng
dc.subjectHeterogeneous systemseng
dc.subjectParallel programmingeng
dc.titleExploração de múltiplos algoritmos de escalonamento de núcleos OpenCL para sistemas de processamento em nuvem multi-inquilino baseados em CPUS e GPUSpor
dc.title.alternativeExploration of multiple scheduling algorithms for OpenCL kernels on multi-tenant cloud systems based on CPUS and GPUSeng
dc.typeTrabalho de Conclusão de Curso de Graduaçãopor
dc.degree.localSanta Maria, RS, Brasil.por
dc.description.resumoComputação em nuvem provê serviços de compartilhamento de recusos computacionais para a execução de aplicações dos inquilinos atráves de computation offloading. Para lidar com a carga computacional os nós da nuvem podem integrar unidades de processamento multinúcleos com unidades de processamento gráfico. Esta heterogeneidade do sistema abrange aplicações com massivo paralelismo ao nível de instruções, threads e dados, que podem ser exploradas através do modelo de programação OpenCL, levando a diminuição do tempo de execução das aplicações dos inquilinos e redução da energia consumida pelo provedor de serviços. Este trabalho propõe um framework para a execução de aplicações OpenCL em um ambiente de nuvem multi-inquilino formado por CPU e GPU, capaz de escalonar e escolher o melhor dispositivo de maneira transparente, sem modificação do código-fonte , com a finalidade de melhor utilizar os recursos computacionais, reduzir o tempo de execução e energia. Cinco algoritmos de escalonamento são explorados: First Come First Served, Weighted Round Robin, Max Min, Min Min e First Fit. A execução de aplicações do conjunto de benchmarks Polybench é utilizado para a avaliação do desempenho do framework em configurações de hardware formadas por um processador Intel Xeon Haswell combinado a NVIDIA Tesla K20m, NVIDIA Tesla K80 ou NVIDIA GeForce 1080 Ti. Dentre todas as configurações, First Fit é o algoritmo que se destaca com aceleração média de 3,04 até 3,80 vezes, com reduções de energia de 33% em média quando comparado a execução exclusiva da GPU.por
dc.publisher.countryBrasilpor
dc.publisher.initialsUFSMpor
dc.subject.cnpqCNPQ::ENGENHARIASpor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Acesso Aberto
Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Aberto