1. 研究目的与意义
在全球经济一体化加速、市场竞争日益激烈的今天,买方市场越来越占据主导地位。企业的竞争方式正在从产品竞争过渡到顾客满意的竞争,顾客满意度也成为衡量企业好坏的核心标准之一。同时,随着大数据时代的到来,商业竞争也将逐渐转变为数据竞争,而顾客满意度调查数据反映了顾客对商品或服务的最直接的感受,因而是企业把握消费者需求、掌握市场动态、进行经营战略规划和调整的最重要数据支撑之一。然而,和其他社会调查一样,由于各种原因,数据缺失在顾客满意度调查中也是一个普遍现象。如果数据缺失不加处理或简单删除,一方面会浪费用于满意度调查的支出,另一方面也会降低数据质量,影响顾客满意度的进一步处理和分析,从而降低结果可信性。如果采取重新调查的方式,则会增加调查成本,同时也不能保证重新调查数据的完整性。所以,缺失数据的修补对保证数据质量、准确挖掘数据价值具有重要意义。
在数据化运营日益凸显和数据缺失普遍存在的背景下,数据缺失的相关研究成为了国内外研究关注的焦点之一。在顾客满意度调查研究中,大多数研究偏重于对顾客满意度指数及其模型的构建与分析,往往忽视了缺失值的问题。因此,研究顾客满意度调查数据中的修补方法,一方面对缺失值修补方法理论的完善具有一定作用,另一方面对于提高企业顾客满意度调查结果有效性进而提高调查质量具有重要价值。
2. 研究内容和预期目标
顾客满意度调查中不可避免地存在数据缺失值,影响调查数据的完整性,进而对满意度的数据分析造成干扰。因此本文研究顾客满意度调查中数据缺失值的修补方法。顾客满意度调查数据属于定序数据,也就是具有顺序的分类数据,因而数据处理中的分类技术比较适用于顾客满意度数据缺失值的修补。所以,本文拟解决的主要问题是将分类技术中的支持向量机技术用于顾客满意度缺失数据的修补之中。
具体而言,本文主要的研究内容和拟解决的问题如下:
(1) 通过查阅相关文献,介绍数据缺失值的定义,阐述数据缺失的原因。
3. 国内外研究现状
一、国外研究综述
国外对缺失数据的研究起步早,而且研究比较深入、系统。在20世纪后半叶,国外已经产生了诸多缺失值修补方法,如均值修补法、热卡修补法、冷卡修补法、回归修补法以及模型修补法等等。chapman(1976), nordbotten(1963)深入讨论了冷卡修补方法在周期性调查中的应用。之后,sander (1983), ford(1983), chapman(1976)等学者对热卡修补方法进行探讨并改进。随着这两种修补方法的广泛讨论和关注,kalton等人1984年在热卡修补方法的基础上提出了最近邻修补方法,也即树枝分类的距离函数匹配方法,以弥补热卡修补方法和回归修补方法存在的问题,随后最近邻修补方法得到了广发的应用。此外,rubin, dempster及laizd(1977)首次提出了一种使得不完全数据得到有效估计的算法--em算法。em算法作为一种处理观测数据中含有缺失值时来简化求解极大似然估计的迭代算法,具有较好的实践应用价值,但是收敛速度慢和计算难度较大是该算法突出的特点。在em算法得到了推广之后,rubin, dempster及laizd随后提出了gem算法。rubin, meng等人(1973)又提出了ecm算法。在1994年由lin和rubin进一步提出了ecme等。rubin基于em算法在20世纪80年代初期的一些文章中率先提出了多重修补方法。
从20世纪90年代初至今。国外研究者提出了诸多对原有方法的改进、扩展,以及对相关理论进行了整理总结。还有学者对不同方法进行了比较研究、实证研究及对修补后数据的方差估计的研究。 alan olinsky,shaw chen及lisa harlow(2003)对结构方程模型中两种数据缺失值修补方法进行了比较研究。a. rogier t. donders,geert j.m.g及van der heijden等(2006)学者对数据修补方法做出了简要的介绍和对比。 joost r. van ginkel,l. andries van der ark及klaas sijtsma等(2007)提出了用贝叶斯方法估算测试和问卷中的缺失值以及准确的近似值的方法。rhian m. daniel和michael g. kenward(2012)进行了提高多重修补法稳定性的研究。
4. 计划与进度安排
|
(2)论文研究主要阶段时间节点: 2022年12月15日:完成开题报告; 2022年1月10日:完成论文初稿 2022年3月10日:完成论文二稿; 2022年4月10日:完成论文定稿 2022年6月20日:完成论文答辩 |
5. 参考文献
[1]laird.n.m,d.b.rubin. maximam likelihood estimation from incomplete data via the em algorithm[j].journal of the royal statistical society,1977,39(1):1-38.
[2]d.b.rubin, rosenbaum.p.r. the central role of the propensity score in observational studies for causal effects[j]. biometrika,1983(70):41-55.
[3] rubin db. multiple imputation for non response in surveys. new york: wiley; 1987.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。