《8、梁中耀-基于机器学习的蓝藻预测预警方法研究(24页).pdf》由会员分享,可在线阅读,更多相关《8、梁中耀-基于机器学习的蓝藻预测预警方法研究(24页).pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、基于机器学习基于机器学习的的蓝藻预测预警蓝藻预测预警方法研究方法研究1 北京英特北京英特-锐锐思计算智能实验室思计算智能实验室2 北京大学北京大学第五届中国水环境模型与智能决策研讨会第五届中国水环境模型与智能决策研讨会云南云南 玉溪玉溪2018年年10月月Email:1邹锐邹锐1,2、梁中耀、梁中耀2、刘永、刘永21 1 大数据时代:大数据时代:水质预测预警的机遇与挑战水质预测预警的机遇与挑战21 1.1.1 水质管理进入大数据时代水质管理进入大数据时代 水质管理大数据水质管理大数据(Big or Intensive Data)的来源的来源 手动监测数据的时空累积和开放获取手动监测数据的时空累
2、积和开放获取 自动监测站的建立和自动监测站的建立和自动监测数据自动监测数据的开放获取的开放获取 遥感解译遥感解译 高高精度精度水质模型的水质模型的输出输出结果结果 水质管理:预测和预警水质管理:预测和预警 预测预测:水质:水质指标指标(未来时刻未来时刻)的的浓度值浓度值 预警预警:水质指标:水质指标未来时刻的未来时刻的达标达标(超过特定阈值超过特定阈值)状况状况 蓝藻的预测和预警蓝藻的预测和预警 富营养化和藻类水华:危害严重,形势严峻富营养化和藻类水华:危害严重,形势严峻 大大数据时代数据时代(长时间连续观测数据长时间连续观测数据):如何进行有效的预测预警:如何进行有效的预测预警31.21.2
3、 自动监测数据自动监测数据预测和预警:机遇预测和预警:机遇和和挑战挑战 自动监测数据自动监测数据 VS VS 常规监测数据常规监测数据数据数据自动监测自动监测常规监测常规监测频次频次高高(秒、小时、天秒、小时、天)低低(周、月周、月)数据量数据量大大(M、G)小小(K)自相关自相关强强弱、无弱、无42 2 一种思路:一种思路:“水质模型“水质模型-机器学习”机器学习”52.12.1 如何解决传统方法失效问题如何解决传统方法失效问题()()()()()11111,=,tfttftittitCttCttttttottotttfWhxbiWhxbCtanh WhxbCfCiCoWhxbhotanh
4、C=+=+=+=+=()()()()()()123456 回归方法:共线性、非线性回归方法:共线性、非线性 一般机器学习方法:高维度一般机器学习方法:高维度 普通普通递归递归神经网络:神经网络:误差爆炸或消失误差爆炸或消失无法解决长时依赖问题无法解决长时依赖问题(最多最多10步步)LSTM:保证短期记忆能力的条件下,时滞步长可达保证短期记忆能力的条件下,时滞步长可达1000技术关键:技术关键:Constant Error Backpropagation6 数据数据-模型融合的模型融合的3种方式种方式 在自动监测时间序列缺乏的条件下,通过能够准确描述湖泊系统动态的高度非在自动监测时间序列缺乏的条
5、件下,通过能够准确描述湖泊系统动态的高度非线性动力学模型线性动力学模型(可靠的水质模型可靠的水质模型),获取次生大数据,获取次生大数据72.22.2 如何解决自动监测数据匮乏的问题如何解决自动监测数据匮乏的问题水质模型 湖泊系统次生大数据 观测大数据3 3 案例介绍案例介绍8 输入输入(4(4类类9 9个个)模型结构:模型结构:隐层隐层个数个数1 1(138)(138)、4 4(145)(145)、1010(145)(145)、2020(153)(153)、3030(152)(152)、4040(148)(148)、6060(103)(103)、8080(106)(106)边界边界条件条件天数
6、天数5 5(227)(227)、1010(227)(227)、2020(226)(226)、4040(225)(225)、6060(185)(185)3.13.1 LSTMLSTM模型模型(1)(1)水温:水温:TEMTEM(2)(2)生物量:生物量:CHLCHL、CHCCHC(3)(3)磷:磷:TPTP、TPNTPN、PO4PO4(4)(4)氮:氮:TNTN、TNNTNN、TINTIN1234560.000.100.200.30输入变量个数的出现频率93.23.2 模型输出结果模型输出结果 模型输出与分析对象模型输出与分析对象1090个个LSTM模型,每个模型有模型,每个模型有15组组(实际