统计方法应用开题报告

 2021-08-08 03:17:40

1. 研究目的与意义

概率统计作为数学专业的必修课程。数据处理的能力是信息与计算科学学生就业的主要能力之一。

统计方法是指用以收集数据、分析数据和由数据得出结论的一系列方法。回归分析是处理变量之间相关关系的一种统计方法。它是用来表示如何确定因变量和自变量之间的最佳关系,量化它们之间的关系强度,以及当给定自变量时去预测因变量的值。在大多数使用回归分析的研究问题中,回归模型所需要的自变量不止一个,由于科学问题大都很复杂,从而使得我们需要利用多元回归模型去预测重要的因变量。当模型的结构为线性时就是多元线性回归模型。

另外,在用传统方法难以解决的问题中,某些问题含有不确定的随机因素,分析起来通常比确定性的模型困难。有的模型难做定量分析,得不到解析的结果或者是有解析结果,但计算代价太大以至不能使用,在这种情况下,可以考虑随机模拟的方法即montecarlo方法。该方法是一类以概率统计理论为指导的非常重要的数值计算方法,也是一种用于解决数值问题的基于计算机的统计抽样方法。

概率统计作为数学专业的必修课程。数据处理的能力是信息与计算科学学生就业的主要能力之一。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

ArnoldZellner(19272010)是美国著名的经济学家和统计学家,专注于贝叶斯估计和计量经济学的领域,在贝叶斯分析和计量经济建模领域开创了先河,在《BayesianandNon-BayesianAnalysisoftheRegressionModelwithMultivariateStudent-tErrorTerms》中假设误差向量具有多元学生分布带有零位置向量和标量分散矩阵,分析多元线性回归模型,多元柯西和正态分布是特殊情况。研究发现,在扩散的先验分布下通常的最小二乘估计值是最大似然估计和后验分布的均值。建立在通常的统计和统计基础上的推断显示出有效性。运用分布而不是分布能做出关于多元分布的尺度参数的推断。MichaelH.Kutne(亚特兰大埃默里大学教授)、ChrisJ.Nachtsheim(美国明尼苏达大学教授)和JohnNeter(美国乔治亚大学教授)所著的书《AppliedLinearStatisticalModels》在统计建模方面是长期以来的最具权威性的文本参考,书中首先讨论了几种多元回归模型,然后以矩阵形式提出了多元回归的基本统计结果,最后以一个例子做出结论说明多元线性回归分析统计推断和残差分析。高惠璇(北大教授)在《统计计算》中重点讨论了一个因变量与多个自变量的线性回归模拟的计算方法、介绍了随机数的产生与检验以及随机模拟方法。书中介绍了多元线性回归模型的参数估计与假设检验的一些方法:基于正规方程的回归算法、利用正交-三角分解进行回归计算等。张德丰等人在《详解MATLAB在统计与工程数据分析中的应用》中介绍了多元线性回归分析的MATLAB程序实现代码。孙荣恒在《应用数理统计》中重点讲述了多元线性回归模型所要考虑的主要问题:用最小二乘法估计与,从而建立与之间的关系式;对线性模型假设与的某种假设进行检验;对进行预测与对自变量进行控制。

3. 研究的基本内容与计划

这里主要研究统计方法--多元线性回归分析法的应用。

基本思路是:先用观测数据建立回归方程,再利用随机模拟方法来检验回归方程预报效果的有效性。若是有效的回归方程,则用来预测,以便更好做出控制。

具体如下:

1设是一个可观测的随机变量,它受到个非随机因索,,,和随机因素的影响,若与,,,有如下线性关系:

(1)

其中,,,是个未知参数,是不可测的随机误差,且通常假定.我们称式(1)为多元线性回归模型.称为被解释变量(因变量),为解释变量(自变量).

称 (2)

为理论回归方程.

对于一个实际问题,要建立多元回归方程,首先要估计出未知参数,,,,为此我们要进行次独立观测,得到组样本数据,,他们满足式(1),即有

(3)

其中相互独立且都服从.

式(3)又可表示成矩阵形式:(4)

这里,,,,,为阶单位矩阵.

阶矩阵称为资料矩阵或设计矩阵,并假设它是列满秩的,即.

由模型(3)以及多元正态分布的性质可知,仍服从维正态分布,它的期望向量为,方差和协方差阵为,即.

参数的最小二乘估计:多元线性回归方程中的未知参数可用最小二乘法来估计,即我们选择使误差平方和

达到最小.

由于是关于的非负二次函数,因而必定存在最小值,利用微积分的极值求法,得

这里是的最小二乘估计.上述对求偏导,求得正规方程组的过程可用矩阵代数运算进行,得到正规方程组的矩阵表示:

移项得 (5)

称此方程组为正规方程组.

依据假定,所以.故存在.解正规方程组(5)得

                 (6)

称为经验回归方程.

2回归分析随机模拟试验

(1)由因变量的观测值计算和:

(2)重复做次随机模拟试验。即对重复执行以下两个步骤:

(a)产生个正态分布随机数:;

(b)用代替观测值,并和自变量的次观测数据一起建立回归方程,同时计算复相关系数值.

(3)利用次模拟试验所得复相关系数的值,给出的经验分布,并估计的值。如果该值大于给定的显著性水平,则认为回归预报的效果和随机预报的效果相比较,差异不显著,这表明回归预报效果不可靠,可以拒绝接受回归方程。,表明回归预报的效果是显著的,可以接受回归方程。

时间

进度及要求

备注

2012年12月-2013年1月

完成选题

与指导教师进行联系、沟通论文事宜

2013年3月

完成开题报告,参考文献不少于8篇,相应教师签署意见

提交开题报告的书面和电子文档

2013年4月

完成论文初稿;指导教师审阅

学生于2012年4月30日前提交修改后的论文初稿

约4月中下旬进行论文中期检查

2013年5月

论文修改阶段,最后定稿

论文送相应教师评审

学生于2012年5月20日前完成论文定稿

2013年5月底

毕业论文答辩

4. 研究创新点

多元线性回归分析主要解决以下几方面的问题。

1确定自变量和因变量

2建立回归预测模型

3用随机模拟方法检验回归方程的有效性

4计算并确定预测值

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。