Mineração de dados paralela e distribuída baseada no ambiente Weka
Resumo
O desenvolvimento tecnológico tem permitido a geração e o registro de volumes de
dados cada vez maiores. A Mineração de Dados, de uma maneira geral, consiste na aplicação
de algoritmos sobre grandes bases de dados com a finalidade de extrair conhecimento
útil não trivial dessas. Devido ao tamanho das bases de dados atuais e a complexidade
das técnicas envolvidas, torna-se vantajoso o uso de soluções distribuídas para o processo
de mineração de dados. O WEKA (Waikato Environment for Knowledge Analysis) é um
ambiente de mineração de dados centralizado que tem sido usado como base para ferramentas
de mineração de dados paralelas e distribuídas. O presente trabalho tem por
objetivo explorar, através de um estudo de caso, a ferramenta de processamento paralelo
e distribuído Grid WEKA. Nesse contexto, são identificadas as técnicas implementadas,
a disponibilidade de paralelismo e distribuição e é feita a análise e discussão do desempenho
da ferramenta utilizando diferentes técnicas de mineração de dados em diferentes
configurações do ambiente distribuído.
Coleções
Os arquivos de licença a seguir estão associados a este item: