MLFV: uma abordagem consciente do estado da rede para orquestração de cadeias de funções de aprendizado de máquina
Abstract
As plataformas de Aprendizado de Máquina como Serviço (MLaaS) vem possibilitando a aplicação
de técnicas de Aprendizado de Máquina (ML) de qualquer lugar e a qualquer momento.
Essas plataformas, em geral, são hospedadas na nuvem e possuem infraestruturas escaláveis
com um alto poder de processamento; no entanto, apresentam algumas desvantagens como a
necessidade de realizar a transferência dos dados para a nuvem. A aplicação de ML na borda
da rede (Edge Computing) está surgindo como uma opção para reduzir algumas das limitações
impostas por essas plataformas, diminuindo, por exemplo, a latência e o uso da rede; além
disso, evita problemas com relação a privacidade e segurança dos dados por mantê-los na rede
interna. No entanto, a aplicação de ML na borda ainda apresenta desafios de pesquisa, como,
por exemplo, a orquestração de funções de ML levando em consideração o atual estado da rede
e as capacidades computacionais dos nodos. Neste sentido, serviços de orquestração de funções
conscientes do estado da rede, como os fornecidos por plataformas de Virtualização de
Funções de Rede (NFV), podem ser uma abordagem promissora para gerenciar a distribuição
das tarefas de ML. Este trabalho propõe o MLFV (Machine Learning Function Virtualization),
uma abordagem consciente do estado da rede que explora um ambiente de NFV para orquestrar
a execução de cadeias de funções de ML; essas cadeias representam o fluxo de execução das
funções, podendo ser agrupadas de forma sequencial e/ou paralela. A abordagem de MLFV
implementa um modelo matemático para colocação de cadeias de ML que, considerando restrições
de CPU, memória, bibliotecas necessárias e sobrecarga de rede, objetiva reduzir o tempo
total de execução de todas as funções de uma cadeia. O modelo distribui as funções de forma a
reduzir a sobrecarga na rede, o que acarreta na redução no tempo total de execução, principalmente
em casos em que a rede apresenta instabilidade. Para avaliar a abordagem de MLFV foi
realizado um estudo de caso na área de geotecnia, utilizando dados de sensores para reproduzir
o processo de classificação de solos através de duas cadeias de funções de ML; essas cadeias,
implementadas pelo MLFV, foram criadas com base no processo de Descoberta de Conhecimento
em Base de Dados (KDD). Os experimentos demonstraram que o MLFV obteve, em
média, uma redução no tempo de execução de 25% em comparação às abordagens de ML na
nuvem (MLaaS) e na borda (Edge) em um cenário com conexão de rede estável. Em um cenário
onde os nodos computacionais apresentavam restrições de largura de banda, o MLFV foi
capaz de identificar essas limitações, alocando as tarefas de ML nos hosts com conexão estável.
As outras abordagens não foram capazes de detectar essas instabilidades, acarretando em um
aumento de 400% no tempo de execução das cadeias de funções.
Collections
The following license files are associated with this item: