dc.creator | Schuh, Mateus Sabadi | |
dc.date.accessioned | 2019-06-05T14:40:29Z | |
dc.date.available | 2019-06-05T14:40:29Z | |
dc.date.issued | 2019-01-30 | |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/16754 | |
dc.description.abstract | LiDAR (Light Detection and Ranging) remote sensing data combined with machine learning
techniques has presented great potential for modeling large-scale forest atributes. In this
context, the work aims to evaluate the application of machine learning techniques in the
construction of models that relate LiDAR metrics and forest inventory data in the prediction of
biomass in tropical forest. Initially, above-ground biomass was computed by an adjusted
allometric equation, using biometric variables inventoried in 85 sample units at Fazenda
Cauaxi, in the municipality of Paragominas / PA. The biomass of the plots (variable of interest)
was related to 87 LiDAR metrics (explanatory variables), obtained by processing the LiDAR
points clouds. This database was randomly divided into 70% for model adjustment and 30% for
validation. The predictive performance of three different machine learning techniques (Random
Forest - RF, Support Vector Machine - SVM and Artificial Neural Networks - ANN) was
compared to a Generalized Linear Model (GLM) technique, traditionally used in nonparametric
estimations. The results indicated that the information derived from the airborne
LiDAR survey proved to be efficient and perfectly applicable to the modeling process of
biomass in a tropical environment. With the exception of the RF model, with R² of 0.60, the
machine learning models obtained better performance in the training stage. The value of 0.99
for the R² and the superior performance in the other adjustment quality indicators (RMSE, Syx,
BIAS and DM), gave the ANN model the condition of better adaptation to the training data. In
the validation stage, the GLM and RF models that presented the worst indicators in relation to
the adjustment, showed superior performance, while the ANN estimates showed the greatest
distortion. In general, the Spearman correlation between the estimated and observed values
presented a behavior inversely proportional to the degree of adjustment of the models in the
training stage, varying from 0.57 to 0.87 for the ANN and GLM models respectively. In spite
of the lower adjustment of the RF model and the lower generalization capacity of the ANN and
SVM models, the Wilcoxon Rank Sum Test did not detect a significant difference between the
biomass values observed and predicted by the different models. In this way, it was possible to
observe that the machine learning algorithms were able to detect and reproduce well the nonparametric
data structure and to cope with generalized regression, without the need for data
dimensionality reduction techniques, which gave more agility to the modeling process. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | por |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Mensuração florestal | por |
dc.subject | Inteligência artificial | por |
dc.subject | Amazônia | por |
dc.subject | Sensoriamento remoto | por |
dc.subject | Forest measurement | eng |
dc.subject | Artificial intelligence | eng |
dc.subject | Amazon | eng |
dc.subject | Remote sensing | eng |
dc.title | Modelos preditivos de biomassa em Floresta Amazônica a partir de dados LiDAR | por |
dc.title.alternative | Predictive biomass models in Amazon Rainforest by LiDAR data | eng |
dc.type | Dissertação | por |
dc.description.resumo | Dados de sensores remotos LiDAR (Light Detection and Ranging), combinados com técnicas
de aprendizado de máquina tem apresentado grande potencial para a modelagem de atributos
florestais em larga escala. Nesse contexto, o trabalho tem como objetivo avaliar a aplicação de
técnicas de aprendizado de máquina na construção de modelos que relacionam métricas LiDAR
e dados de inventário florestal na predição de biomassa em floresta tropical. Inicialmente, foi
computada a biomassa acima do solo por meio de uma equação alométrica ajustada, fazendo
uso de variáveis biométricas inventariadas em 85 unidades amostrais na Fazenda Cauaxi,
município de Paragominas/PA. A biomassa das parcelas (variável de interesse) foi relacionada
com 87 métricas LiDAR (variáveis explicativas), obtidas via processamento das nuvens de
pontos LiDAR. Essa base de dados foi dividida aleatoriamente em 70% para ajuste dos modelos
e 30% destinados à validação. Comparou-se o desempenho preditivo de três diferentes técnicas
de aprendizado de máquina (Random Forest - RF, Support Vector Machine - SVM e Artificial
Neural Network - ANN) frente a técnica Generalized Linear Model - GLM, tradicionalmente
empregada em estimativas não paramétricas. Os resultados indicaram que as informações
derivadas do levantamento LiDAR aerotransportado mostraram-se eficientes e perfeitamente
aplicáveis ao processo de modelagem da biomassa em ambiente tropical. À exceção do modelo
RF, com R² de 0,60, os modelos de aprendizado de máquina obtiveram melhor desempenho na
etapa de treinamento. O valor de 0,99 para o R² e o desempenho superior nos demais indicadores
da qualidade de ajuste (RMSE, Syx, BIAS e DM), conferiram ao modelo ANN a condição de
melhor adequação aos dados de treino. Já na etapa de validação, os modelos GLM e RF que
haviam apresentado os piores indicadores em relação ao ajuste, mostraram desempenho
superior, enquanto que as estimativas ANN apresentaram a maior distorção. De modo geral, a
correlação de Spearman entre os valores estimados e observados apresentou comportamento
inversamente proporcional ao grau de ajuste dos modelos na etapa de treinamento, variando de
0,57 a 0,87 para os modelos ANN e GLM respectivamente. A despeito do ajuste inferior do
modelo RF e da menor capacidade de generalização dos modelos ANN e SVM, a estatística
Wilcoxon Rank Sum Test não detectou diferença significativa entre os valores de biomassa
observados e preditos pelos diferentes modelos. Dessa forma, foi possível observar que os
algoritmos de aprendizado de máquina conseguiram detectar e reproduzir bem a estrutura não
paramétrica dos dados e fazer frente a regressão generalizada, sem a necessidade da aplicação
de técnicas de redução da dimensionalidade dos dados, o que conferiu mais agilidade ao
processo de modelagem. | por |
dc.contributor.advisor1 | Pereira, Rudiney Soares | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9479801378014588 | por |
dc.contributor.referee1 | Hendges, Elvis Rabuske | |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/5292160200165795 | por |
dc.contributor.referee2 | Silva, Emanuel Araújo | |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/2765651276275384 | por |
dc.creator.Lattes | http://lattes.cnpq.br/4673313670767417 | por |
dc.publisher.country | Brasil | por |
dc.publisher.department | Recursos Florestais e Engenharia Florestal | por |
dc.publisher.initials | UFSM | por |
dc.publisher.program | Programa de Pós-Graduação em Engenharia Florestal | por |
dc.subject.cnpq | CNPQ::CIENCIAS AGRARIAS::RECURSOS FLORESTAIS E ENGENHARIA FLORESTAL | por |
dc.publisher.unidade | Centro de Ciências Rurais | por |