Mostrar registro simples

dc.contributor.advisorCharao, Andrea Schwertner
dc.creatorPereira, Adriano
dc.date.accessioned2022-07-18T14:15:36Z
dc.date.available2022-07-18T14:15:36Z
dc.date.issued2010-12-06
dc.date.submitted2010
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/25391
dc.descriptionTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010.por
dc.description.abstractHuge data sets have been generated from computing tools. Implicit patterns could be present in this data. Data mining worries in look for relationship, specially, in large data sets, enabling the extration of useful new information. Distributed computing allows the data decentralization and speeds up the data mining process. Apache Mahout is a distributed data mining tool, which uses MapReduce program model, promising scalability by spliting the workload in independents tasks, among themselves. This work has as objective to verify Apache Mahout’s performance, through a implemented algoritms’ choice, data set preparation and mining of these data in differents distributed environments, analyzing the tool’s scalability, as the performance improvement due to nodes’ or cores’ addition to the processing.eng
dc.languageporpor
dc.rightsAcesso Abertopor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectMineração de dadospor
dc.subjectMineração de dados distribuídapor
dc.subjectApache Mahoutpor
dc.titleMineração de dados distribuída e escalável usando Apache Mahoutpor
dc.typeTrabalho de Conclusão de Curso de Graduaçãopor
dc.degree.localSanta Maria, RS, Brasil.por
dc.description.resumoGrandes volumes de dados vêm sendo gerados por ferramentas computacionais. Nestes dados, podem haver padrões implícitos, a partir dos quais pode ser possível extrair novos conhecimentos. A mineração de dados preocupa-se com a busca de relações, especialmente, em grandes quantidades de dados, possibilitando a extração de novas informações úteis. O uso de computação distribuída permite a descentralização dos dados e a aceleração do processo de mineração. Apache Mahout é uma ferramenta para a mineração de dados distribuída, que faz uso do modelo de programação MapReduce, prometendo escalabilidade ao dividir a carga de trabalho em tarefas independentes entre si. Este trabalho tem como objetivo verificar o desempenho do Apache Mahout, através da seleção de algoritmos implementados pela ferramenta, preparação de um conjunto de dados, e execução destes algoritmos, neste conjunto de dados, em diferentes ambientes distribuídos, analisando a escalabilidade da ferramenta, quanto ao ganho de desempenho em relação ao acréscimo de nodos ou núcleos ao processamento.por
dc.publisher.countryBrasilpor
dc.publisher.initialsUFSMpor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Acesso Aberto
Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Aberto