《黄国鑫-第六届中国国际土壤与地下水高峰论坛 (已加密).pdf》由会员分享,可在线阅读,更多相关《黄国鑫-第六届中国国际土壤与地下水高峰论坛 (已加密).pdf(40页珍藏版)》请在三个皮匠报告上搜索。
1、大数据支持的区域土壤污染风险管控决策方法研究Studies on big data-supported decision-making methods for risk control of region-scale soil contamination黄国鑫黄国鑫 博士博士 研究员研究员 2022年年08月月17日日汇汇 报报 提提 纲纲研究背景与进展13结 语风险管控决策系列方法开发2 2研究背景与进展1政府数据开源数据爬取数据p中国科学院数据云p地理空间数据云p地理国情监测云p中国知网平台pp互联网(社交平台、电商)p移动互联网(微信、QQ、短信)p物联网(视频采集器、传感器)p我 国
2、场 地 污 染 大 数 据 的 数 据 来 源 与 基 础土壤和地下水污染大数据:指面向土壤生态环境保护与管理决策的应用服务需要,组织起来的一个超大、难以用现有常规的数据库管理技术和工具处理的数据集。p“七五”土壤背景值调查p全国土壤污染状况调查p全国土壤污染状况详查p全国三次污染源普查p建设项目环境影响评价p疑似污染场地调查、风险评价和治理修复p我国土壤污染我国土壤污染大数据大数据基本形成基本形成我国土壤污染大数据基本形成基于Web of Science核心数据库,利用“土壤污染”“重金属”“风险识别”“风险管控”等主题词,对2010年-2020年文献进行词频分析,分别分析了大数据、传统风险
3、管控研究热点。传 统 场 地 污 染 风 险 管 控 研 究 时 序 演 化 分 析“大 数 据 和 机 器 学 习”为 关 键 词 的 高 频 词 汇 时 序 演 化 分 析总体总体研究进展研究进展与趋势:与趋势:大数据大数据支持土壤支持土壤污染污染风险管控风险管控研究进展研究进展 例例1:基于:基于NLP的的土壤数据提取与结构化土壤数据提取与结构化利用自然语言处理方法,自动提取和结构化文本中的土壤环境信息。基于知识工程法获取信息的流程图(适用于书写格式统一的信息,如坡度、海拔、温度、降水、无霜期)基于随机条件场(CRF)法获取信息的流程图(适用于书写格式非统一的信息,如地形、母质)第一步:
4、知识架构构建第二步:基于规则和统计的信息提取TextsSentence segmentationSentence setDictionaryClause selection for target variableChinese word segmentationPart-of-speech taggingRulebaseExtraction of variable valueTextsAnnotationTraining setValidation setModel trainingCRFs modelPreprocessingEvaluationVariable valuePredictNe
5、w textPreprocessingFeature vectorTheme of frame:value Soil type Elevation:value Landform:value Parent material:value Soil sample Elevation:value Frost-free period:value Annual precipitation:value Wang et al.,2019321j.XnX2X1ymy1借助武汉6个城镇1161个土壤点位数据,以径向基函数神经网络(RBFNN)为基础,利用基于自适应学习的微粒群优化(SLPSO)产生RBFNN输出层
6、的权重和偏差,利用基于自适应调整的均方根反向传播(ARMSProp)优化RBFNN全部参数,进而构建基于深层复合模型(DCM)的土壤重金属浓度预测方法,优化了RBFNN的初始变量、加快了其收敛速度、改进了预测效果。p 不同函数条件下SLPSO的均值和标准偏差均低于其他方法,表明其收敛准确度优于其他方法。Cao and Zhang,2021DCM架构RBFNN结构不同预测模型的土壤Ni浓度预测(RRBFNN-RBFNN+均方根反向传播(RMSProp);ARBFNN-RBFNN+ARMSProp)迭代后粒子值的均值和标准偏差(PSO-微粒群优化;GPSO-线性转换PSO)Input layerH