Mostrar registro simples

dc.creatorMaraschin, Mikael
dc.date.accessioned2023-06-20T15:30:35Z
dc.date.available2023-06-20T15:30:35Z
dc.date.issued2023-04-24
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/29514
dc.description.abstractThe determination of physical-chemical properties for substances is of paramount importance in the field of chemical engineering, as these are related to equipment sizing, operational conditions, and process efficiencies. Since experimental data for certain substances are not always available, it is necessary to develop and use equations to determine these properties. In recent decades, there has been a popularization of machine learning algorithms. Through an interactive training process with a database, these algorithms have become capable of making predictions. In order to evaluate the integration between different methods for property prediction, a total of 551 data points for pure substances, consisting of carbon, hydrogen, oxygen, nitrogen, and sulfur, were used. These pure substances were represented computationally by the number and type of atoms or by the number and type of chemical bonds between these atoms. These variables served as inputs for all trained models. To establish the relationship between these substances and their respective thermodynamic properties, namely the heat of combustion and formation, multivariable linear regression models, symbolic regression, artificial neural networks, gradient boosting based on decision trees, and regression vector support machines were employed. All of these methods were trained using a data split of 70% for training, 15% for validation, and 15% for testing. Finally, the multivariable linear regression model, specifically for the description based on chemical bonds, outperformed the other methods. It resulted in a Pearson correlation coefficient of 99.93% and 96.43% for the test data of heat of combustion and heat of formation, respectively. This demonstrates that the linear model approach is suitable for organic substances composed of C, H, O, N, S. In addition to evaluating the goodness of fit, a local contribution analysis was employed for each input variable using a calculation methodology derived from game theory, known as Shapley values. This analysis allowed for the identification of the influence of each variable in comparison with the average value predicted by the model.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpor
dc.languageporpor
dc.publisherUniversidade Federal de Santa Mariapor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectCalor de combustãopor
dc.subjectCalor de formaçãopor
dc.subjectModelos de aprendizado de máquinapor
dc.subjectValores Shapleypor
dc.subjectHeat of combustioneng
dc.subjectHeat of formationeng
dc.subjectMachine learning modelseng
dc.titleComparação de modelos de aprendizado de máquina interpretáveis na predição de calor de combustão e de formaçãopor
dc.title.alternativeComparison of interpretable machine learning models for prediction of heat of combustion and formationeng
dc.typeDissertaçãopor
dc.description.resumoA determinação das propriedades físico-químicas para substâncias é de suma importância na área da engenharia química, uma vez que estas propriedades estão relacionadas ao dimensionamento de equipamentos, às condições operacionais e às eficiências dos processos. Como nem sempre os dados experimentais para determinadas substâncias estão disponíveis, torna-se necessário o desenvolvimento e a utilização de equações para determinar estas propriedades. Nas últimas décadas, houve uma popularização dos algoritmos de aprendizado de máquina, que, por meio de um processo iterativo de treinamento com um banco de dados, se tornaram capazes de fazer previsões. Com o objetivo de avaliar a integração entre os métodos de predição de propriedades, utilizaram-se o calor de combustão e de formação de um total de 551 dados de substâncias puras constituídas por carbono, hidrogênio, oxigênio, nitrogênio e enxofre. Essas substâncias puras foram representadas computacionalmente pelo número e tipo de átomos ou pelo número e tipo de ligações químicas entre esses átomos, que foram as variáveis de entrada para todos os modelos treinados. Para relacionar estas substâncias e suas respectivas propriedades termodinâmicas, especificamente o calor de combustão e formação, foram empregados os modelos de regressão linear multivariável, regressão simbólica, redes neurais artificiais, gradiente boosting baseado em árvores de decisão e máquina de suporte de vetor de regressão. Todos estes métodos foram treinados com uma divisão dos dados de 70% para treinamento, 15% para validação e 15% para teste. Por fim, o modelo de regressão linear multivariável, no caso de descrição por ligações químicas, apresentou desempenho superior aos outros métodos, resultando em coeficiente de correlação de Pearson de 99,94% e 96,43% para os dados de teste do calor de combustão e do calor de formação, respectivamente. Isso demonstra que a abordagem de um modelo linear é adequada para substâncias orgânicas compostas por C, H, O, N, S. Além da avaliação da qualidade do ajuste, também foi empregada a análise de contribuição local para cada variável de entrada, por meio de uma metodologia de cálculo proveniente da teoria dos jogos, denominada valores Shapley, permitindo identificar a influência de cada variável em comparação com o valor médio predito pelo modelo.por
dc.contributor.advisor1Salau, Nina Paula Gonçalves
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4234840503539989por
dc.contributor.advisor-co1Lanzanova, Thompson Diórdinis Metzka
dc.contributor.referee1Rocha, Luiz Alberto Oliveira
dc.contributor.referee2Fagundez, Jean Lucca Souza
dc.creator.Latteshttp://lattes.cnpq.br/9816449389376898por
dc.publisher.countryBrasilpor
dc.publisher.departmentEngenharia Químicapor
dc.publisher.initialsUFSMpor
dc.publisher.programPrograma de Pós-Graduação em Engenharia Químicapor
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA QUIMICApor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Attribution-NonCommercial-NoDerivatives 4.0 International
Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivatives 4.0 International