环境敏感变量优选及机器学习算法预测绿洲土壤盐分

Transactions of the Chinese Society of Agricultural Engineering(2018)

引用 12|浏览3
暂无评分
摘要
基于机器学习预测干旱区(如新疆)土壤盐分的研究目前较少涉及且敏感变量的筛选还需深入探讨.该研究比较5种机器学习算法(套索算法,The Least Absolute Shrinkage and Selection Operator-LASSO;多元自适应回归样条函数,Multiple Adaptive Regression Splines-MARS;分类与回归树,Classification and Regression Trees-CART;随机森林,Random Forest-RF;随机梯度增进算法,Stochastic Gradient Treeboost-SGT)在3个不同地理区域(奇台绿洲,渭-库绿洲和于田绿洲)的性能表现;参与的变量被分为6组:波段,植被相关变量集,土壤相关变量集,数字高程模型(digital elevation model,DEM)衍生变量集,全变量组,优选变量组(全变量组经过算法筛选后的变量集合).通过算法筛选,以示不同研究区的盐度敏感变量.同时借助以上述6组结果评判算法的性能.结果表明:综合分析6个变量组的R2和RMSE,预测精度排名如下:优选变量组>植被指数变量组>土壤相关变量组>波段>DEM衍生变量组.由于结果不稳定,全变量组未参与排名.在所有变量中,植被指数(EEVI,ENDVI,EVI2,CSRI,GDVI)和土壤盐度指数(SIT,SI2和SAIO)与土壤盐度相关性高于其他变量.综合评价以上5种算法,Lasso和MARS的预测结果出现极端异常值,但其预测结果能基本呈现土壤盐分空间分布格局.CART的结果能清晰分辨灌区和非灌区土壤盐分的分布态势,但二者内部并无太多变化且稳定性较差.RF和SGT的结果显示,二者在3个绿洲的土壤盐分值域范围和土壤盐分空间分布格局相似,纹理信息相对其他3个算法更为丰富.更为重要的是,算法在各个地区的结果都较为稳定.二者相比,SGT验证精度相对最高,其次为RF.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要