Modelos de aprendizado de máquina interpretáveis aplicados na predição da separação e purificação de frutooligosacarídeos
View/ Open
Date
2023-02-16Primeiro coorientador
Kuhn, Raquel Cristine
Primeiro membro da banca
Carvalho, Frede de Oliveira
Segundo membro da banca
Forte, Marcus Bruno Soares
Terceiro membro da banca
Silveira, Christian Luiz da
Quarto membro da banca
Rodrigues, Rodolfo
Metadata
Show full item recordAbstract
A separação e a purificação de frutooligossacarídeos é crucial para aplicações industriais em que tais métodos são extrememente necessários. No entanto, algumas características específicas do processo podem afetar a seletividade de separação. Neste trabalho, foram utilizados modelos de aprendizado de máquina e técnicas de explicação aditivas a fim de identificar e analisar as principais variáveis que afetam o processo de separação. Inicialmente, foi realizado uma comparação entre carvão ativado e zeólita como adsorventes em colunas de leito fixo, para determinar qual deles tem a maior seletividade para separação de frutooligossacarídeos. Para a comparação dos adosrventes, foram utilizadas eXtreme Gradient Boosting e Shapley Additive explanation para determinar as melhores condições de processo para cada adsorvente considerando as variáveis, temperatura, tempo e concentração de etanol no eluente. O eXtreme Gradient Boosting apresentou alto poder preditivo para ambos os adsorventes, atingindo de 0,84 0,91 para carvão ativado e 0,87 0,98 para zeólita. O carvão ativado mostra seletividade para frutooligossacarídeos em baixas concentrações de etanol (7,95% v/v). A zeólita exigiu concentrações de etanol cerca de 8 vezes maiores do que o carvão ativado. Na segunda etapa, foi realizada a previsão das concentrações dos sacarídeos separados de uma mistura contendo frutooligossacarídeos em colunas de leito fixo de zeólita, por meio de diferentes modelos de aprendizado de máquina, Árvores de Decisão, Floresta Randômica, Gradient Boosting, AdaBoost e Redes Neurais Artificiais. A importância das variáveis foi realizada em modelos baseados em árvore. As variáveis de entrada foram tempo, temperatura, concentração de etanol, taxa de fluxo do eluente, razão percentual de volume da injeção para o leito. O Gradient Boosting foi o melhor modelo para prever as concentrações, mostrando 0,600 0,840,
0,0590 22,318 e 0,187 3,002 para dados de teste. Variáveis mais significativas: concentração de etanol (para a concentração de glicose), razão percentual de volume da injeção para o leito (para a concentração de frutose) e tempo (para a concentração de sacarose e frutooligossacarídeos). Por último, foi realizada uma prospecção na literatura de diferentes condições experimentais, como tipo de adsorvente, tipo de eluente, concentração de eluente, taxa de fluxo de eluente, temperatura, dimensões da coluna, que afetam a pureza dos frutooligossacarídeos. Para isso foi realizada uma seleção do melhor modelo, AdaBoost, Árvore de Decisão, Floresta Randômica, eXtreme Gradient Boosting, K Nearest Neighbors, e Regressão Ridge, para a predição da pureza. Após a seleção, o melhor modelo foi otimizado e aplicada a metodologia Shapley Additive explanation para identificar as variáveis mais importantes. O melhor modelo para a predição foi a Floresta Randômica, apresentando de 0,935, de 0,868, de 36,313, de 4,849, de 6,026, e de 7,885%, para dados de teste. De acordo com a Shapley Additive explanation as variáveis que mais afetam a pureza são: diâmetro, concentração de eluente, temperatura, taxa de fluxo do eluente, carvão ativado como adsorvente e comprimento. Os resultados obtidos mostraram que o aprendizado de máquina é uma ferramenta valiosa para entender melhor as condições ideais para a separação de frutooligossacarídeos, permitindo taxas de recuperação mais altas e maior eficiência.
Collections
The following license files are associated with this item: