Modelos preditivos de biomassa em Floresta Amazônica a partir de dados LiDAR
Resumo
Dados de sensores remotos LiDAR (Light Detection and Ranging), combinados com técnicas
de aprendizado de máquina tem apresentado grande potencial para a modelagem de atributos
florestais em larga escala. Nesse contexto, o trabalho tem como objetivo avaliar a aplicação de
técnicas de aprendizado de máquina na construção de modelos que relacionam métricas LiDAR
e dados de inventário florestal na predição de biomassa em floresta tropical. Inicialmente, foi
computada a biomassa acima do solo por meio de uma equação alométrica ajustada, fazendo
uso de variáveis biométricas inventariadas em 85 unidades amostrais na Fazenda Cauaxi,
município de Paragominas/PA. A biomassa das parcelas (variável de interesse) foi relacionada
com 87 métricas LiDAR (variáveis explicativas), obtidas via processamento das nuvens de
pontos LiDAR. Essa base de dados foi dividida aleatoriamente em 70% para ajuste dos modelos
e 30% destinados à validação. Comparou-se o desempenho preditivo de três diferentes técnicas
de aprendizado de máquina (Random Forest - RF, Support Vector Machine - SVM e Artificial
Neural Network - ANN) frente a técnica Generalized Linear Model - GLM, tradicionalmente
empregada em estimativas não paramétricas. Os resultados indicaram que as informações
derivadas do levantamento LiDAR aerotransportado mostraram-se eficientes e perfeitamente
aplicáveis ao processo de modelagem da biomassa em ambiente tropical. À exceção do modelo
RF, com R² de 0,60, os modelos de aprendizado de máquina obtiveram melhor desempenho na
etapa de treinamento. O valor de 0,99 para o R² e o desempenho superior nos demais indicadores
da qualidade de ajuste (RMSE, Syx, BIAS e DM), conferiram ao modelo ANN a condição de
melhor adequação aos dados de treino. Já na etapa de validação, os modelos GLM e RF que
haviam apresentado os piores indicadores em relação ao ajuste, mostraram desempenho
superior, enquanto que as estimativas ANN apresentaram a maior distorção. De modo geral, a
correlação de Spearman entre os valores estimados e observados apresentou comportamento
inversamente proporcional ao grau de ajuste dos modelos na etapa de treinamento, variando de
0,57 a 0,87 para os modelos ANN e GLM respectivamente. A despeito do ajuste inferior do
modelo RF e da menor capacidade de generalização dos modelos ANN e SVM, a estatística
Wilcoxon Rank Sum Test não detectou diferença significativa entre os valores de biomassa
observados e preditos pelos diferentes modelos. Dessa forma, foi possível observar que os
algoritmos de aprendizado de máquina conseguiram detectar e reproduzir bem a estrutura não
paramétrica dos dados e fazer frente a regressão generalizada, sem a necessidade da aplicação
de técnicas de redução da dimensionalidade dos dados, o que conferiu mais agilidade ao
processo de modelagem.
Coleções
Os arquivos de licença a seguir estão associados a este item: