MLFV: uma abordagem consciente do estado da rede para orquestração de cadeias de funções de aprendizado de máquina

Souza, Renan Lirio de

View/Open

Dissertação de Mestrado (1.146Mb)

Date

2019-08-21

Author

Souza, Renan Lirio de

Primeiro orientador

Machado, Alencar

Primeiro membro da banca

Rizzetti, Tiago Antonio

Segundo membro da banca

Villaca, Rodolfo da Silva

Metadata

Show full item record

Abstract

As plataformas de Aprendizado de Máquina como Serviço (MLaaS) vem possibilitando a aplicação de técnicas de Aprendizado de Máquina (ML) de qualquer lugar e a qualquer momento. Essas plataformas, em geral, são hospedadas na nuvem e possuem infraestruturas escaláveis com um alto poder de processamento; no entanto, apresentam algumas desvantagens como a necessidade de realizar a transferência dos dados para a nuvem. A aplicação de ML na borda da rede (Edge Computing) está surgindo como uma opção para reduzir algumas das limitações impostas por essas plataformas, diminuindo, por exemplo, a latência e o uso da rede; além disso, evita problemas com relação a privacidade e segurança dos dados por mantê-los na rede interna. No entanto, a aplicação de ML na borda ainda apresenta desafios de pesquisa, como, por exemplo, a orquestração de funções de ML levando em consideração o atual estado da rede e as capacidades computacionais dos nodos. Neste sentido, serviços de orquestração de funções conscientes do estado da rede, como os fornecidos por plataformas de Virtualização de Funções de Rede (NFV), podem ser uma abordagem promissora para gerenciar a distribuição das tarefas de ML. Este trabalho propõe o MLFV (Machine Learning Function Virtualization), uma abordagem consciente do estado da rede que explora um ambiente de NFV para orquestrar a execução de cadeias de funções de ML; essas cadeias representam o fluxo de execução das funções, podendo ser agrupadas de forma sequencial e/ou paralela. A abordagem de MLFV implementa um modelo matemático para colocação de cadeias de ML que, considerando restrições de CPU, memória, bibliotecas necessárias e sobrecarga de rede, objetiva reduzir o tempo total de execução de todas as funções de uma cadeia. O modelo distribui as funções de forma a reduzir a sobrecarga na rede, o que acarreta na redução no tempo total de execução, principalmente em casos em que a rede apresenta instabilidade. Para avaliar a abordagem de MLFV foi realizado um estudo de caso na área de geotecnia, utilizando dados de sensores para reproduzir o processo de classificação de solos através de duas cadeias de funções de ML; essas cadeias, implementadas pelo MLFV, foram criadas com base no processo de Descoberta de Conhecimento em Base de Dados (KDD). Os experimentos demonstraram que o MLFV obteve, em média, uma redução no tempo de execução de 25% em comparação às abordagens de ML na nuvem (MLaaS) e na borda (Edge) em um cenário com conexão de rede estável. Em um cenário onde os nodos computacionais apresentavam restrições de largura de banda, o MLFV foi capaz de identificar essas limitações, alocando as tarefas de ML nos hosts com conexão estável. As outras abordagens não foram capazes de detectar essas instabilidades, acarretando em um aumento de 400% no tempo de execução das cadeias de funções.

URI

http://repositorio.ufsm.br/handle/1/19445

Collections

Programa de Pós-Graduação em Ciência da Computação [144]

The following license files are associated with this item:

Creative Commons

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International