全文总字数:4046字
1. 研究目的与意义(文献综述)
1.1课题研究的目的及意义
高维数据经常在许多科学领域中产生,例如视觉类别识别,基因表达分析,时间序列预测等等。若直接使用这些原始的高维数据,在实际处理分析过程中会带来高额计算成本和维数灾难。实际上,由于高维特征空间中涉及有不相关的和冗余的特征,通常认为数据的真实维数要远低于数据本身的维度。因此,通常有两种研究方法:特征提取和特征选择,以学习数据的低维表示。特征提取通过组合原始特征,将原始输入转换为较低维子空间,以构造新特征来减小维度;而特征选择则包括删除一些不相关或弱相关的特征,从而只返回原有特征中的子集。
在机器学习和统计学中,特征选择也被称为变量选择、属性选择或变量子集选择。特征选择因其能简化模型,使之更易于被研究人员或用户理解缩短训练时间,改善通用性、降低过拟合,是最重要的降维技术之一。特征选择算法可以被视为搜索技术和评价指标的结合。前者提供候选的新特征子集,后者为不同的特征子集打分。常见的特征选择方法大致可以分为三类:过滤式、包裹式和嵌入式。
2. 研究的基本内容与方案
2.1研究的基本内容、目标
降维方法一直是机器学习领域的热点研究问题,特征选择是降维方法的主要方法,基于谱分析的特征选择算法是当前的研究热点,通过算法去除这些冗余和不相关特征,选择原始数据的重要特征子集。本文的主要内容如下:
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
1.berminghamml, pong-wong r, spiliopoulou a, et al. application of high-dimensional featureselection: evaluation for genomic prediction in man. scientific reports.5:10312.
2.do h, cheon m-s,kim sb. graph structured sparse subset selection. information sciences. 2020.
3.du l, shen yd.unsupervised feature selection with adaptive structure learning.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。