Mostrar registro simples

dc.contributor.advisorMergen, Sergio Luis Sardi
dc.creatorCardoso, Paulo Vinicius Mendonça
dc.date.accessioned2022-05-31T20:45:12Z
dc.date.available2022-05-31T20:45:12Z
dc.date.issued2016-12-16
dc.date.submitted2016
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/24635
dc.descriptionTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2016.por
dc.description.abstractThe Information Retrieval (RI) is a research area involved in creating solutions for databases search. The aim of RI is to answer a user information needed. A common data structure used to assist the search process is the inverted index, composed by entries that lead to a related object list. In this context, an object search can be done by equivalence or similarity. Similarity search is a powerful method, since it can retrieve the most similar objects according to the request. However, the complexity involved in computing the similarity can harm the performance, making it necessary to resort to alternative processing techniques. The distributed computing was created to help finding solutions for this type of problem, with tools, paradigms and distributed architectures. The MapReduce paradigm is an example of distributed model with the purpose of processing a big amount of data on cluster environments. This model fits into the inverted index search context because of its key-value architecture. Thus, the aim of this work is to analyses the distributed processing tools that implement the MapReduce concept over a similarity search problem that relies on an inverted index. The results shows how different frameworks behave under several test scenarios.eng
dc.languageporpor
dc.publisherUniversidade Federal de Santa Mariapor
dc.rightsAcesso Abertopor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectSparkeng
dc.subjectHadoopeng
dc.subjectMapReduceeng
dc.subjectÍndice invertidopor
dc.subjectRecuperação de informaçãopor
dc.subjectDesempenhopor
dc.titleAnálise do desempenho da busca por similaridade utilizando o paradigma MapReducepor
dc.typeTrabalho de Conclusão de Curso de Graduaçãopor
dc.degree.localSanta Maria, RS, Brasil.por
dc.description.resumoA Recuperação de Informação (RI) é uma área de pesquisa envolvida na criação de soluções para buscas em repositórios de dados, a fim de se atender à uma necessidade de informação do usuário. Uma estrutura bastante utilizada para consultas em RI é o índice invertido, onde uma entrada do índice leva à lista de objetos associados. Nesse contexto, buscas por objetos podem ser definidas por equivalência ou por similaridade. Buscas por similaridade apresentam uma perspectiva mais poderosa, já que permitem a recuperação dos objetos mais similares às consultas. Porém, o cálculo de similaridade pode tornar o processo complexo e custoso, podendo ser necessário recorrer à técnicas alternativas de processamento. A computação distribuída foi criada para atender a esse tipo de problema, oferecendo soluções como ferramentas, modelos e arquiteturas distribuídas. Um paradigma de computação distribuída que pode-se aplicar em buscas com índice invertido é o MapReduce, proposto para o processamento de grandes quantidades de dados em ambientes de cluster. Desta forma, o objetivo deste trabalho é analisar o funcionamento de ferramentas de processamento distribuído que implementam o MapReduce em um problema de busca com índices invertidos. Os resultados mostram as diferenças de desempenho dos frameworks através de diversos cenários de teste.por
dc.publisher.countryBrasilpor
dc.publisher.initialsUFSMpor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Acesso Aberto
Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Aberto