Exploração e benchmarking de uma implementação de MapReduce: o caso do Hadoop na plataforma Grid’5000
Abstract
A partir da demanda pela análise de grandes quantidades de informações, em espaços
de tempos viáveis, o modelo de programação MapReduce ganhou espaço científico e
comercial, devido ao aproveitamento do paralelismo para dividir a carga de dados e obter
ganho de desempenho. Uma das principais implementações deste modelo de programação
é a Hadoop MapReduce, que foi selecionada como objeto de estudo deste trabalho.
Neste trabalho, tem-se como objetivos gerais a criação de um ambiente de testes para
Hadoop na plataforma Grid’5000, além da exploração e seleção de ferramentas de benchmarking
para este framework. São apresentados também neste trabalho, uma revisão
teórica sobre os conceitos já citados, o processo de desenvolvimento, bem como a apresentação
e avaliação dos resultados obtidos.
Collections
The following license files are associated with this item: