1. 研究目的与意义
2017年5月,alphago以3∶0的比分击败围棋世界排名第一柯杰。次年5月,警方通过人脸识别在张学友赣州演唱会抓捕逃犯。从无人驾驶汽车,智能家居到多国语言在线翻译,人工智能已经渗透到日常生活的方方面面。
机器学习(machine learning,ml)是人工智能领域的一个分支,其主要包括两种,监督学习和非监督学习[1]。机器学习发展至今,包含了深度学习算法,人工智能算法,回归算法,决策树算法,贝叶斯算法,聚类算法等。90年代,vapnik等人在统计学习理论 (statistical learning theory,slt)的基础上提出支持向量机(support vector machines, svm)算法[2]。我国学者在80年代末就注意到统计学习理论的基础成果,但那时少有人研究。
支持向量机是用来解决二分类问题的有监督学习算法(基于核函数的svm与三层前向神经网络等价)[3]。它近似实现结构风险最小化原理(structure risk minimization,srm)[4],控制分类器的推广能力,比人工神经网络(ann)拥有更好的遗传性,它是专门针对有限样本情况的,目标不仅仅是得到样本趋于无穷大时的最优值,而是现有信息下的最优解[5]。
2. 研究内容和预期目标
主要研究内容:
本课题主要研究svm的基本原理和实现方法,并利用python语言对数据数据进行分类和识别。本课题还将选取另一种机器学习算法—k均值聚类(k-means)算法对数据进行分类与识别,并将两种算法的实验结果进行比较,从准确率、工作效率的特点对系统进行实验评价。
svm是用来解决二分类问题的有监督学习算法,在引入了核方法之后svm也可以用来解决非线性问题。随着样本数据集规模的扩大,如何完善算法以提升效率值得研究。同时,从二维数据到多维数据的分类处理需要对svm进行改进。
3. 研究的方法与步骤
研究方法:
本课题采用svm 和 k-means这两种分类模型对数据进行分类和识别并进行比较,k-means算法采用与svm相同的数据进行测试。svm算法与k-means算法属于两类不同的方法,一个是有监督一个是无监督,观察结果比较两种算法的准确率,推论两者的有缺点以及应用范围。同时,进一步研究svm算法从二维简单数据的处理扩展到多维复杂数据的处理。
根据要求安装配置pycharm和anaconda环境,解库函数的调用以及其程序的实现过程,通过进行一些调试和案例实验,生成随机数据,一部分样本数据用于训练,一部分用于测试完善模型,并分析结果。
4. 参考文献
[1]余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[j].计算机研究与发展,2013,50(09):1799-1804.
[2]柳回春,马树元.支持向量机的研究现状[j].中国图象图形学报,2002(06):100-105.
[3]张铃.基于核函数的svm机与三层前向神经网络的关系[j].计算机学报,2002(07):696-700.
5. 计划与进度安排
1、2019.3.5-2019.4.5:充分查阅相关资料,撰写并修改完成开题报告;
2、2019.4.6-2019.4.25:深入研究支持向量机的算法原理,并在此基础上利用python语言对数据进行分类识别;
3、2019.4.26-2019.5.20:对程序界面及功能进行改进,以便更符合课题设计要求;
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。