Mostrar registro simples

dc.creatorSilva, Lucas Ferreira da
dc.date.accessioned2022-10-25T18:25:35Z
dc.date.available2022-10-25T18:25:35Z
dc.date.issued2022-09-23
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/26668
dc.description.abstractThe constant technological advances, Web technologies, mobile devices and the popularization of the IoT (Internet of Things), have caused an exponential growth in the volume of data never seen before. This scenario, although positive from a technological point of view, brings many challenges to data processing and storage centers, making necessary the adoption of tools and technologies most adapted to deal with this paradigm. Thus, distributed databases are the most suitable solution for this scenario, since characteristics such as horizontal scalability, elasticity and high availability allow such technologies to keep up with the growing data volume and sources. However, in the same way that the volume of data increases, also increases the demands of computational power, investment, space and energy consumption of the infrastructures as a whole to provide the environment of the distributed databases. In that way, this work explores the use of a low-power cluster composed of SBCs (Single Board Computers), for the implementation of distributed databases, in order to validate the feasibility of using this type of cluster as a compact, cheap and with lower energy consumption alternative for the common data center infrastructures. In that way, this work explores the use of a low-power cluster composed of SBCs (Single Board Computers), for the implementation of distributed databases, in order to validate the feasibility of using this type of cluster as a compact, cheap and with lower energy consumption alternative for the common data center infrastructures. Fifteen Raspberry Pi 3 B devices were used to compose the cluster, which supports a virtualization layer of Docker containers orchestrated by the Docker Swarm tool. The performance of Cassandra, Hbase and PostgreSQL/Citus databases on the SBC cluster was evaluated, using YCSB benchmark workloads to analyze execution time, latency and throughput in scenarios with different replication factors. The results show that, in general, Cassandra outformed the other databases and obtained the best results, showing no influence by the replication factor. The results for Hbase and Citus were heavily penalized by the increase of the replication factor. Furthermore, the results also prove the ability of the low-power cluster to meet the requirements of distributed systems used in real scenarios, allowing to the distributed environment elasticity and high availability.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpor
dc.languageporpor
dc.publisherUniversidade Federal de Santa Mariapor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectBancos de dados distribuídospor
dc.subjectRaspberry Pipor
dc.subjectBaixo-consumopor
dc.subjectComputadores de placa únicapor
dc.subjectSBCspor
dc.subjectDockerpor
dc.subjectDocker Swarmpor
dc.subjectBig datapor
dc.subjectNoSQLpor
dc.subjectDistributed databaseseng
dc.subjectLow-powereng
dc.subjectSingle board computerseng
dc.titleImplantação de bancos de dados distribuídos em um cluster de baixo consumopor
dc.title.alternativeAn evaluation of relational and NoSQL distributed databases on a low-power clustereng
dc.typeDissertaçãopor
dc.description.resumoOs constantes avanços tecnológicos, o crescimento do uso das tecnologias Web, aumento do número de dispositivos móveis e a popularização da IoT (Internet of Things), têm ocasionado um crescimento exponencial de volume de dados nunca antes visto. Este cenário, apesar de positivo sob o ponto de vista tecnológico, traz inúmeros desafios para os centros de processamento e armazenamento de dados, fazendo-se necessária a adoção das ferramentas e tecnologias mais adaptadas a lidar com esse paradigma. Assim, os bancos de dados distribuídos apresentam-se como a solução mais adequada para esse contexto, já que características como escalabilidade horizontal, elasticidade e alta disponibilidade possibilitam que tais tecnologias consigam acompanhar o crescimento vertiginoso do volume e fontes dos dados. Entretanto, da mesma forma que o volume de dados aumenta, aumentam também as demandas de poder computacional, investimento, espaço e consumo energético das infraestruturas como um todo para propiciar a implantação dos bancos de dados distribuídos. Pensando nisso, neste trabalho é explorada a utilização de um cluster de baixo consumo composto por SBCs (Computadores de Placa Única), para a implantação de bancos de dados distribuídos, com o intuito de validar a viabilidade do uso desse tipo de cluster como uma alternativa compacta, barata e com menor consumo energético para composição das infraestruturas dos data centers. Foram utilizados 15 dispositivos Raspberry Pi 3 B para compor o cluster, o qual sustenta uma camada de virtualização por contêineres Docker orquestrados pela ferramenta Docker Swarm. Foram avaliados os desempenhos dos bancos de dados Cassandra, Hbase e PostgreSQL/Citus sobre o cluster de SBCs, sendo utilizadas cargas de trabalho do benchmark YCSB para analisar tempo de execução, latência e throughput em cenários com diferentes fatores de replicação. Os resultados mostram que, no geral, dentre os bancos de dados escolhidos o Cassandra obteve os melhores resultados, além de não demonstrar influência do fator de replicação no seu desempenho. Por outro lado, os resultados para o Hbase e Citus foram fortemente penalizados pelo aumento do fator de replicação. Ademais, a experimentação conduzida evidenciou a capacidade do cluster de baixo consumo de atender as exigências dos sistemas distribuídos utilizados em cenários reais, permitindo ao ambiente distribuído elasticidade e alta disponibilidade.por
dc.contributor.advisor1Lima, João Vicente Ferreira
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266546896929217por
dc.contributor.referee1Charao, Andrea Schwertner
dc.contributor.referee2Schepke, Claudio
dc.creator.Latteshttp://lattes.cnpq.br/6181181274261109por
dc.publisher.countryBrasilpor
dc.publisher.departmentCiência da Computaçãopor
dc.publisher.initialsUFSMpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Attribution-NonCommercial-NoDerivatives 4.0 International
Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivatives 4.0 International