Python机器学习应用-鸢尾花分类识别开题报告

 2021-10-18 21:56:01

1. 研究目的与意义(文献综述包含参考文献)

文献综述数码相机的普及,使得花朵的各种形态可以以图像的方式呈现,可以采用计算机技术对花朵图像进行分析处理,识别植物物种。

将图像识别技术应用于鸢尾花品种分类,根据鸢尾花型的特点,采用机器学习算法识别鸢尾花品种。

研究成果能帮助专业人员对鸢尾花进行快速识别与分类,并对其他花朵品种的分类有借鉴意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

一种优秀决策树分类算法的特点是产生最少量的、深度最小的叶子,且应用这种决策树分类算法分析海量数据的精度尽量高;同时决策树不能太复杂,太复杂会加重运算负担,还会出现过度拟合的情况。

本课题将以此为标准构建一个决策树分类模型,决策树在生成和修剪中使用cart算法,最后使用此模型预测鸢尾花的种类。

基于分类回归树(cart)模型的分类方法,采用scikit-learn中加载iris数据集作为本课题的实验数据,该集合包含3类鸢尾花植物(setosa、versicolor、virginica)的数据,每类数据包含了50组数据,每组数据包含了花萼长度和宽度、花瓣长度和宽度4个维度的属性,将数据集分为训练集与测试集,将训练样本分为预测变量和目标变量数据集,将基尼系数作为选择最佳测试变量和分割阈值的准则,循环二分形成二叉树式的决策树结构,并采用最小误差剪枝,最终得到一个最优二叉树。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。