
1、课题目的及意义
近些年来,我国基础设施、房地产行业和建筑行业发展迅猛,我国的大气环境遭受到严重破坏。为了能够有效地保护大气环境,进一步的减少空气污染带来的危害,我国在各个地区建立空气质量自动监测站用来监测和监控空气污染物。
通过定期或连续监测空气环境中存在的主要污染物,对空气质量是否满足国家制定的空气质量标准进行判断,为空气环境质量评价报告的编写提供有力的数据。通过空气质量预测,可对空气质量变化规律与发展趋势进行相应的研究,并且还可促进空气污染预测预报工作的顺利开展。能够为政府部门实行相关环境保护法规、开展环境质量控制工作等提供基础资料与依据。
2、课题主要内容
本论文选用了2018年1月份到2021年12月份36个月AQI数据,可以观察得出在大部分时间,重庆的空气质量为良,没有优和重度污染状况。接下来利用R软件对AQI历史数据进行分析研究,按照AQI序列的分布特征建立多种模型,并根据时序图、AIC准则、白噪声检验、预测数据的精确性等确立出适合的模型,进而根据预测数据的绝对误差和相对误差的比较选择出最优模型——乘积季节模型ARIMA(0,1,2)(0,1,0)12的拟合效果在多种模型中为最优模型。
第一章 绪论
第二章AQI
第三章基于机器学习的重庆空气质量时间序列模型
第四章 基于机器学习的重庆空气质量预测
第五章 总结分析
3、课题可行性分析
1.基本掌握SPSS、MATLAB、Python、R语言等机器学习代码编程软件。
2. 本人电脑的配置具备正常运行上述代码的条件。
3. 已经有学者用麻雀搜索算法(SSA)、神经网络模型、粒子群算法(PSO)、BP模型、LSTM模型、ELM模型、GRU模型、EEMD-SE-ELM模型、EEMD-SE-GRU模型和EMD-SEELM-GRU模型等机器学习预测模型预测空气质量指数(AQI),并且都具有良好的预测效果。
4.机器学习算法的底层代码都与数学有着密不可分的关系并且我大学主修的也是数学专业,对数学公式有更强的理解能力,让代码理解具备更高的可行性。
5.近年来由于国民经济的发展和人们生活水平提高,对空气质量进行预测并加以治理已是重中之重。
4、完成本课题所需的工作条件(如工具书、计算机、实验、调研等)及解决办法
Ø 硬件:一台电脑(笔记本电脑、台式电脑)
Ø 软件:Anaconda Navigator、MATLAB R2018a、Rstudio、Excel、Visio。
Ø 工具书:《机器学习及R应用》、《生物群智计算与机器学习》等。
Ø 数据:重庆市2022年全年每天的空气质量等级空气质量系数、空气质量指数(AQI)、PM2.5指数、PM10指数、SO2指数、NO2指数、CO指数、O3指数。
Ø 数据查找途径:天气后报官网(http://www.tianqihoubao.com/)和天气+的官方网站(http://lishi.tianqi.com/chongqing/)中有所需数据可供提取。
Ø 实验:空气质量等级分类和空气质量指数(AQI)预测。
参考文献
[1] 宫雪然. 基于机器学习的北京空气质量分类预测及长期趋势分析[D].首都经济贸易大学,2020.
[1] 孙家仁,许振成,刘煜,彭晓春,陈来国,李海燕,陶俊,林泽健. 气候变化对环境空气质量影响的研究进展[J]. 气候与环境研究,2011,16(06):805-814.
[2] 修订后的《中华人民共和国大气污染防治法》将于 2016 年 1 月 1 日起施行[J]. 造纸信息,2015,(11):6.
[4]郝红利. 山东省煤炭消费可持续发展评价及调控路径研究[D].山东大学,2021.
[5] 郭欢. 基于 SPSS 的空气质量指数的影响因素分析及预测[J]. 华北科技学院学报,2020,17(04):92-95.
[6] 胡敏,杨宜平. 我国空气质量影响因素的实证研究[J]. 重庆工商大学学报(自然科学版),2021,38(03):94-99.
[7] 康振英. 中部六省城市空气质量时空特征及影响因素分析[D].中南财经政法大学,2020.
[8] 郭雯雯,陈永金,刘阁,宋开山,陶宝先. 2016—2019 年长江中游城市群空气质量时空变化特征及影响因素分析[J]. 生态环境学报,2020,29(10):2034-2044.
[9] Ma J,Ding Y,Jack C,Jiang F, Tan Y,Vincent J,Wan Z. Identification of high impact factors of air quality on a national scale using big data and machine learning techniques[J]. Journal of Cleaner Production,2020,244(C):118955.
[10]Kumar S,Poonam M,Gufran B,Anuja S,Pradhan C,Swetaleena C,Bhishma T. Quantifying the high resolution seasonal emission of air pollutants from crop residue burning in India[J]. Environmental Pollution,2021,286:117165. [11]Małgorzata B, Katarzyna R,Michał M,Paweł F,Maciej S. The way of usage and location in a big city agglomeration as impact factors of the nurseries indoor air quality[J]. Energies,2021,14(22):7534.
[12] Lévano C,Julio D,Alejandro B,José L,Miguel N,Martínez S,Luna M,Beatriz H,Fernando B,Cristina L. Mortality due to COVID-19 in Spain and its association with environmental factors and determinants of health[J]. Environmental Sciences Europe,2022,34(1):39.
[13] Alizadeh M. Tourism impact on air pollution in developed and developing countries[J]. Iranian Economic Review,2020,24(1):159-180.
[14] 翟 维 . 基 于 多 元 线 性 回 归 的 环 境 监 测 数 据 分 析 与 研 究 [J]. 微 型 电 脑 应用,2022,38(03):186-188+192.
[15] 高燕. 基于 AQI 的济南市空气质量的分析及推断[D].山东师范大学,2020. [16]金仁浩,曾国静,赵欣然. 北京地区空气质量影响因素分析及预测研究[J]. 黑龙江科学,2022,13(08):46-50.
[17]刘媛媛,曹宇飞. 集成 CNN-LSTM 预测模型的空气质量可视化平台[J]. 信息技术与信息化,2022,(04):19-22.
[18]叶玉杰. 基于 ARIMA-LSTM 混合模型的短期空气质量预测[D].天津商业大学,2022.
[19]徐艳平,陈义安. 基于随机森林回归和气象参数的城市空气质量预测模型——以重庆市为例[J]. 重庆工商大学学报(自然科学版),2021,38(06):118-124.
[20]夏润,张晓龙. 基于改进集成学习算法的在线空气质量预测[J]. 武汉科技大学学报,2019,42(01):61-67.
[21]Ghaemi Z,Farnaghi M,Alimohammadi A. Hadoop-based distributed system for online prediction of air pollution based on support vector machine[J]. ISPRS - International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences,2015,XL-1-W5(1):215-219.
[22]Nagendra S,Khare M. Artificial neural network based vehicular pollution prediction model: a practical approach for urban air quality prediction[J]. Int. J. of Environment and Waste Management,2010,5(3/4):303-315.
[23]Sohn S. Prediction of ozone formation based on neural network[J]. Journal of Environmental Engineering,2000,126(8):688-696.
[24]Kumari A,Goyal P. Forecasting of air quality index in Delhi using neural network based on principal component analysis[J]. Pure and Applied Geophysics,2013,170(4):711-722.
5、工作思路及方案分析
工作思路:
1) 搜集影响空气质量指数模型的相关数据
2) 清洗数据
3) 对数据进行统计分析
4) 用单一的机器学习模型对数据进行回归拟合,并求出它们的平均绝对百分误差、均方根误差和决定系数用于比较模型的优劣
5) 构造集成学习模型并求出其模型评价指标(同上),并比较模型的优劣
方案分析
1) 数据清洗能使数据更加完整、准确
2) 数据统计分析能初步断定数据所具有的特点,并根据特点调整机器学习模型
3) 模型评价指标能使模型的优劣呈现得更加明显
6、时间安排及工作进度
2023.2.14-2023.2.21:搜集影响空气质量指数模型的相关数据并完成开题报告
2023.2.22-2023.3.1:清洗数据并完成任务书
2023.3.2-2023.3.9:查找相关理论知识并写出文献翻译
2023.3.10-2023.3.17:完成文献综述
2023.3.18-2023.4.1:建立机器学习模型并设计集成学习算法
2023.4.2-2023.4.23:论文初稿撰写
2023.4.24-2023.5.22:完成论文并查重
2023.5.23-2023.5.27:论文修改