1. 研究目的与意义
一.研究背景当今时代,大数据的分析与研究已经成为一个热点话题。在如今这个信息爆炸的时代,获取数据的途径多种多样,可供我们收集的数据也非常丰富,于是我们常常需要对大规模的数据进行分析,因此在面对规模如此巨大的数据时,如何在合理的时间内对它们进行撷取、管理、处理并整理成为助于经营决策更积极目的的信息是一项亟需研究的课题。
而在数学科学的发展过程中,许多数学模型被提出来有助于我们对大量的数据进行分析(比如线性回归分析,主成分分析,支持向量机,奇异值分解),在一些软件(如matlab)的支持下,它们常常用来对维度较大的数据矩阵进行预处理、降维,找出其中的主成分,这有助于进一步对这些数据进行分析。
二.研究目的
2. 研究内容和预期目标
1.从大数据的背景、发展和应用出发,简述大数据研究现状2.研究线性代数、matlab等在大数据分析方面的应用
3.研究matlab可视化工具对数据的可视化处理
4.通过实例,来实现使用了数学模型与矩阵分解等方法的大数据分析
3. 研究的方法与步骤
1) 阐述大数据的发展历程,引出数学模型(线性代数)在其中的应用2) 总结在大数据研究中常用到的与线性代数有关的数学模型(如pca、低秩逼近)
3)通过网络收集大量与某一搜索词相关的文章名,并通过matlab实现潜在语义分析的实验
4) 通过matlab可视化工具实现潜在语义分析结果的可视化
4. 参考文献
[1]wang, l.; wang, y.; chang, q. feature selection methods for big data bioinformatics: a survey from the search perspective. methods 2016, 111, 21–31.[2]wang, y.; yao, h.; zhao, s. auto-encoder based dimensionality reduction. neurocomputing 2016, 184, 232–242.
[3]meng, c.; zeleznik, o.a.; thallinger, g.g.; kuster, b.; gholami, a.m.; culhane, a.c. dimension reduction techniques for the integrative analysis of multi-omics data. brief. bioinform. 2016, 17, 628–641
[4]大数据系统综述[j]. 李学龙,龚海刚.中国科学:信息科学.2015(01)
5. 计划与进度安排
1.2022年2月24日-3月1日:任务书,导师讲授选题状况和要求等;2.2022年2月24日-3月8日:开题报告,导师修改审定开题报告;3.2022年3月9日-5月31日:毕业论文写作,学生按开题报告撰写论文4.2022年4月13日-4月26日:中期检查,汇报课题进展,论文中期检查5.2022年5月4日-5月17日:完成论文初稿,论文初稿修改6.2022年5月18日-5月31日:论文打印、审阅、定稿7.2022年5月25日-6月7日:论文评阅8.2022年6月1日-6月14日:论文答辩
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。