dc.contributor.advisor | Charao, Andrea Schwertner | |
dc.creator | Cassales, Guilherme Weigert | |
dc.date.accessioned | 2022-06-21T19:21:32Z | |
dc.date.available | 2022-06-21T19:21:32Z | |
dc.date.issued | 2014-01-20 | |
dc.date.submitted | 2014 | |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/24968 | |
dc.description | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa
Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2014. | por |
dc.description.abstract | Nowadays the volume of data generated by the services provided for end users, is way
larger than the processing capacity of one computer alone. As a solution to this problem, some
tasks can be parallelized. The Apache Hadoop framework, is one of these parallelized solutions
and it spares the programmer of management tasks such as fault tolerance, data partitioning,
among others. One problem on this framework is the scheduler, which is designed for homogeneous
environments. It is worth to remember that maintaining a homogeneous environment
is somewhat difficult today, given the fast development of new, cheaper and more powerful
hardware. This work focuses on altering the Capacity Scheduler, in order to make it more
context-aware towards resources on the cluster. Making it possible to consider the the physical
capacities of the machines when scheduling the submitted tasks. It was chosen to insert context
information (memory and cpu) collectors on CapacityScheduler, making his scheduling more
context-aware. Through the changes and experiments made using a common and well known
benchmark (TeraSort), it was possible to notice a improvement on scheduling in relation to the
original scheduler using the default configuration. | eng |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Acesso Aberto | por |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Apache Hadoop | por |
dc.subject | Escalonador | por |
dc.subject | Sensibilidade ao contexto | por |
dc.subject | Scheduler | eng |
dc.subject | Context-aware | eng |
dc.title | Desenvolvimento de um escalonador sensível ao contexto para o Apache Hadoop | por |
dc.title.alternative | Development of acontext-aware scheduler for Apache Hadoop | eng |
dc.type | Trabalho de Conclusão de Curso de Graduação | por |
dc.degree.local | Santa Maria, RS, Brasil. | por |
dc.description.resumo | Hoje em dia, o volume de dados gerados é muito maior do que a capacidade de processamento
dos computadores. Como solução para esse problema, algumas tarefas podem ser
paralelizadas ou distribuidas. O framework Apache Hadoop (Apache Hadoop, 2013), é uma
delas e poupa o programador as terefas de gerenciamento, como tolerância à falhas, particionamento
dos dados entre outros. Um problema no escalonador do Apache Hadoop é que seu
foco é em ambientes homogêneos, o que muitas vezes não é possível de se manter. O foco deste
trabalho foi na melhora de um escalonador já existente, possuindo como objetivo torná-lo sensível
ao contexto, permitindo que as capacidades físicas de cada máquina sejam consideradas
na hora da distribuição das tarefas submetidas. Optou-se por inserir coletores de informações
de contexto (memória e cpu) no CapacityScheduler, tornando o comportamento desse sensível
ao contexto. Através das mudanças feitas e de experimentos feitos usando um benchmark bem
conhecido (TeraSort), foi possível demonstrar uma melhora no escalonamento em relação ao
escalonador original com a configuração padrão. | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFSM | por |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | por |
dc.publisher.unidade | Centro de Tecnologia | por |