Implantação de bancos de dados distribuídos em um cluster de baixo consumo
View/ Open
Date
2022-09-23Primeiro membro da banca
Charao, Andrea Schwertner
Segundo membro da banca
Schepke, Claudio
Metadata
Show full item recordAbstract
Os constantes avanços tecnológicos, o crescimento do uso das tecnologias Web, aumento
do número de dispositivos móveis e a popularização da IoT (Internet of Things), têm ocasionado um crescimento exponencial de volume de dados nunca antes visto. Este cenário,
apesar de positivo sob o ponto de vista tecnológico, traz inúmeros desafios para os centros
de processamento e armazenamento de dados, fazendo-se necessária a adoção das ferramentas e tecnologias mais adaptadas a lidar com esse paradigma. Assim, os bancos de
dados distribuídos apresentam-se como a solução mais adequada para esse contexto, já
que características como escalabilidade horizontal, elasticidade e alta disponibilidade possibilitam que tais tecnologias consigam acompanhar o crescimento vertiginoso do volume
e fontes dos dados. Entretanto, da mesma forma que o volume de dados aumenta, aumentam também as demandas de poder computacional, investimento, espaço e consumo
energético das infraestruturas como um todo para propiciar a implantação dos bancos de
dados distribuídos. Pensando nisso, neste trabalho é explorada a utilização de um cluster
de baixo consumo composto por SBCs (Computadores de Placa Única), para a implantação de bancos de dados distribuídos, com o intuito de validar a viabilidade do uso desse
tipo de cluster como uma alternativa compacta, barata e com menor consumo energético
para composição das infraestruturas dos data centers. Foram utilizados 15 dispositivos
Raspberry Pi 3 B para compor o cluster, o qual sustenta uma camada de virtualização
por contêineres Docker orquestrados pela ferramenta Docker Swarm. Foram avaliados
os desempenhos dos bancos de dados Cassandra, Hbase e PostgreSQL/Citus sobre o
cluster de SBCs, sendo utilizadas cargas de trabalho do benchmark YCSB para analisar
tempo de execução, latência e throughput em cenários com diferentes fatores de replicação. Os resultados mostram que, no geral, dentre os bancos de dados escolhidos o
Cassandra obteve os melhores resultados, além de não demonstrar influência do fator de
replicação no seu desempenho. Por outro lado, os resultados para o Hbase e Citus foram
fortemente penalizados pelo aumento do fator de replicação. Ademais, a experimentação
conduzida evidenciou a capacidade do cluster de baixo consumo de atender as exigências
dos sistemas distribuídos utilizados em cenários reais, permitindo ao ambiente distribuído
elasticidade e alta disponibilidade.
Collections
The following license files are associated with this item: