1. 研究目的与意义
随着我国电信网络的迅速发展,电信各专业网络设备和网管系统的数量和类都在不断增加,迫切需要解决网络管理及故障的快速响应问题。进入信息时代,保存在计算机中的文件和数据库中的数据量正在以指数速度增长,同时人们期望从数据中获得更有用的信息。实际上,这些数据中只有一小部分有用,人们正面临数据丰富而知识贫乏的问题[1],所以迫切需要一种新的技术从海量数据中自动、高效地提取所需的有用知识,数据挖掘技术由此而生。数据挖掘的目标是将大容量数据转化为有用的知识和信息。它的目的,就是拓展更加有效的利用已有数据,拓展应用[2]。
对于电信运营商新增一项OpenLab(开放实验室)出租业务来说,面对庞大的用户登入/登出数据,如何有效的进行数据采集与整合对于电信企业是非常重要。采集系统的重点是用户登入/登出时间能否被及时采集,采集后对于数据正确的挖掘,从而确保电信企业的计费系统方便的实施。对于每个登入的用户进行登入/登出的计录,并且把用户的记录进行有效有序的管理,能够高效又可靠的计算出用户的登入/登出时间,因此对于实验室的出租业务必须编出一套数据采集的系统,实现计算机化的操作,此系统的安全可靠对于提高商业效率具有重要意义。
2. 课题关键问题和重难点
采集文件要如何读取:unix服务器的信息都会被自动保存到一个在线日志文件中,而这个文件是一个动态的文件,对同一个文件进行读写操作时会出错的,要分析如何把文件中的内容一步步采集出来。
原文件的解析和匹配:wtmpx是一个二进制的文件,如何对于文件进行读取,以及对于文件中的登入/登出数据进行匹配。
匹配数据要怎样成功的发送:匹配好的数据要如何成功的发送过去,如果发送失败侧如何进行处理,怎样知道数据发送成功多需要解决。
3. 国内外研究现状(文献综述)
数据采集系统在电信计费中的重要性
数据采集系统是电信企业不可缺少的部分,电信计费系统的发展经历了三大历史阶段,人工计费到如今的自动计费,电信计费系统朝着灵活化、复杂化、全面化方向发展已经成为可能。与此同时,由于市场经济下竞争的加剧,计算机技术、数据库的日趋成熟,客户群对电信计费系统提出了更高的要求。为了满足市场的需求,急需寻求一个集实时性、集中性、综合性为一体的电信计费系统。
面对以上新情况,一个适应市场需求的电信计费系统的数据采集系统是非常必须的,有了这样一个系统使资源得到合理和有效的利用。而且随着科学技术的不断提高,计算机科学日渐成熟,其强大的功能已为人们深刻认识,它已进入人类社会的各个领域并发挥着越来越重要的作用。
数据采集系统带来的效益
数据采集系统采用的结构为c/s加上多线程的技术,以及tcp/ip协议的使用。此系统采用先进的计算机科学技术使工作变得轻松,注意力向更高层次转移。由于数据库的使用,采集过来的无序杂乱的数据分成各个详细表来储存,原始数据经过数据挖掘后提取的信息便于被用户理解,数据易于共享导出。数据同步,执行效率高。方便查询打印等。
4. 研究方案
系统的设计方案
1.数据采集模块的设计
2.数据整合模块的设计
5. 工作计划
第1周:查找文献和翻译文献
第2周:撰写开题报告
第3周:dms数据挖掘系统的总体框架设计
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。