1. 研究目的与意义、国内外研究现状(文献综述)
一、研究意义
空气质量的高低与人们的生活息息相关,近年来全国各地频繁出现的空气质量问题引起了社会各界的广泛关注。很多研究表明,空气污染物与人类许多疾病密切相关,尤其是呼吸系统疾病[1]。我国2018年空气质量总体情况要比2017年有所好转,但是我国空气污染物排放量依然居高不下,工业、能源、交通运输等方面排放问题仍较为突出,空气环境综合治理面临的形式依然严峻[2]。因此,人们应更加提高对空气环境质量评价工作的重视程度,加强对空气质量的综合治理,提高空气质量,是当前任务的重中之重,但是影响空气质量的因素多而复杂,只有抓住影响最重要的因素,对症下药,才能有针对性的解决空气污染问题,同时减少很多不必要的治理成本。传统的空气质量评价方法主要是利用模糊数学等机械计算公式,建立空气质量指数和空气质量评价等级之间的映射关系[3]。然而现实生活中的实际问题影响因素错综复杂,数据特征日趋复杂,数据量日益增大,现有的评价方法已经不能够满足实际需要,在实际解决问题的过程中,还存在着许多有待进一步探讨的问题,这就需要我们研究并挖掘新的评价方法。
众多研究人员从上世纪八十年代就已开始研究综合评价问题,随着近些年来新型算法的兴起和发展,研究人员将这些方法引入综合评价中,形成了更加科学可靠的综合评价算法。通过对国内外学者文献的梳理,目前空气质量评价方法主要有以下几种:模糊综合评价,粗糙集法,层次分析法,聚类分析,主成分分析等,但是层次分析方法中大多需要对问题各层权重进行赋值,存在一定的主观性。k均值聚类法能够快速对样本实现聚类,以距离的远近为标准,用主成分分析提取最主要的成分从而分析最主要的影响因素,通过“降维”来进行数据的综合评价及排序,在“降维”的过程中原始数据的大部分信息都能被保留,保证数据的真实性,这样就可以较为全面地对事物进行评价。因此考虑k均值聚类与主成分分析相结合,结合两个单一模型的优点,从而形成适合对空气质量评价领域的组合模型。
2. 研究的基本内容和问题
一、研究目标
用聚类算法对主要城市空气质量数据进行聚类,能得出综合客观的结论,用主成分分析法提取最主要的主成分从而分析最主要的影响因素,且在“降维”过程中保留了大部分数据信息。从而形成适合对空气质量评价领域的组合模型。
二、研究内容
3. 研究的方法与方案
一、研究方法
首先在中国统计年鉴上搜集重点城市近两年的环境空气质量数据,对其进行聚类分析,得到各个城市空气质量的不同类别,并根据不同类别的质心来判定每个类别中空气质量的好坏。而后对数据进行主成分分析,取累计贡献率较大的前几个主成分,分析得到对空气质量影响较大的因素。
二、技术路线
三、实验方案 |
1)在中国统计年鉴官网上搜集近两年来的重点城市环境空气质量数据;
2)用K均值算法对主要城市空气质量进行聚类,根据每类质心的数值判定该类别空气质量的好坏;
3)用主成分分析提取最主要的前几个主成分,并分析影响空气质量的主要因素;
4)结合二者分析结果,对主要城市空气质量形成综合客观的评价。
四、可行性分析
1)作者对于这个课题有着浓厚的学习兴趣,以优秀成绩完成统计学相关课程,熟悉聚类和主成分分析等相关算法,有着较好的数学基础,且对数据分析以及数学建模具有浓厚的学习欲望。
2)聚类分析法作为模式识别技术的一种方法,它能客观实际地反映空气的污染状况,为正确掌握空气环境质量现状以及实施空气污染综合治理提供比较具体的科学依据。主成分分析通过研究如何通过几个主成分来解释多个变量间的内部结构,并且给综合指标所包含的信息以适当解释,从而更加深刻地揭示事物的内在规律,因此被广泛应用于空气质量评价中,并得出影响空气质量的重要因素。
3)指导老师多年来指导本科生毕业论文工作,有较好的工作基础。
4. 研究创新点
目前,我国对于空气质量评价一般采用国颁《环境空气质量标准》将空气中某种污染物浓度与国颁标准值进行比较,以此达到分类的目的,但这种做法的不足之处是没有考虑不同等级的多种污染物对分类的共同影响。随着机器学习算法的发展,K均值聚类和主成分分析方法被广泛应用于各个研究领域,特别是在空气环境质量评价中越来越受到重视,用K均值法对主要城市空气质量数据进行聚类,能得出综合客观的结论,用主成分分析法提取最主要的主成分从而分析最主要的影响因素,且在“降维”过程中保留了大部分数据信息。
5. 研究计划与进展
2020.1-2020.2搜集数据,查阅文献,知识学习,了解国内外研究现状
2020.3-2020.5编写代码,进行实验,并对结果进行分析,撰写论文
2020.5毕业论文答辩
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。