进一步提升PM2.5浓度
预测精度的同时增强模型的可解释性,对深化大气污染防治,助推区域经济高质量
发展有一定的现实意义。以空气污染物和气象条件作为特征因子,提出一种基于XGBoost与SHAP的PM2.5浓度预测模型。首先,利用Lasoo对原始特征变量
数据集进行处理,将处理完的数据作为XGBoost模型的输入进行迭代训练实验,以此获得性能最佳的预测模型。然后,使用SHAP对模型特征进行解释。结果表明,基于XGBoost的PM2.5浓度预测模型在RMSE,MAE和R2三组指标上优于对比模型;综合SHAP、XGBoost和随机森林的特征变量重要性分布结果,识别影响PM2.5浓度的关键因素。