1. 研究目的与意义(文献综述)
1.1 研究目的及意义
从实践的角度给出智能web应用的定义,这也是成为本次设计的原则。这个定义分三个部分(1)数据聚合;(2)参考结构;(3)具有学习能力;能处理不确定性的算法[1]。
基于用户的协同过滤通过用户对物品或信息的偏好(如打分或表明喜恶立场等)分析,发现用户之间的相似性,基于相似用户进行物品或信息的推荐。基于用户的协同过滤是个性化推荐中最古老的算法,该方法在1992年被提出,并应用于邮件过滤系统;1994年grouplens创建了第一个自动化推荐系统—"grouplens”推荐系统[2],该系统被用于新闻过滤,向用户推荐新闻,帮助新闻的阅读者获得其感兴趣的新闻内容。
2. 研究的基本内容与方案
2.1 目标(开发的系统概况描述)
本课题旨在以Web新闻门户网站为研究场景,重点完成基于内容推荐方法的基础之上,利用主题模型和关键词对新闻内容进行抽象表示,为每人用户定制专属个性化兴趣模型,通过对勾选推荐新闻与用户兴趣间距离来计算匹配是否推荐给用户。目的是挖掘出用户的内在兴趣爱好,提高准确率以及用户满意度。
2.2 技术路线
2.2.1 构建系统模型
图2.1系统模型
基于内容的门户Web个性化推荐系统如图2.1所示,主要分为三个部分[15]:新闻模型表示,用户兴趣模型的构建及新闻推荐生成。它通过合理的方法抽象表示出新闻内容和隐藏主题,为不同的用户构建不同的兴趣模型,从而实现新闻推荐的个性化,为了提高推荐的准确性和多向性,在新闻推荐生成部分包含了冗余删除过滤,主题分组以及时间全职排序等过程。
2.2.2 构建用户兴趣模型
用户行为在个性化推荐的应用中一般分为两种:显示行为和隐式行为。显示行为是用户明确表示对物品兴趣喜好的行为。例如用户对某些新闻表示喜欢并推荐了它,或发布了某条新闻。隐式行为指的是那些不能明确反应用户兴趣喜好的行为,最具代表性的就是用户的普通页面浏览行为,用户浏览一条新闻的页面并不代表用户一定喜欢这条新闻的内容,只有通过大量的统计分析获得的用户喜好才更具说服力。
对于本文所描述的推荐的对象新闻来说,新闻网站的主要行为分类如下表2.2所示:
显示行为 | 隐式行为 |
发布新闻 | 阅读新闻 |
评论新闻 | 浏览新闻 |
收藏新闻 |
|
表2.2用户行为分类
在对用户的行为进行收集和分类后,需要用一个统一的方式表示这些行为,表2.3给出了一种表示方式,它将一个用户行为表示为6个部分,包括产生行为的用户和行为的对象、行为的种类、产生行为的上下文、行为的内容和权重。
名称 | 描述 |
user_id | 用户的唯一标识 |
item_id | 行为的对象唯一标识 |
behavior_type | 行为的种类 |
context | 行为的环境(时间,地点) |
behavior_weight | 行为的权重 |
behavior_content | 行为的内容 |
表2.2用户行为记录
2.2.3 构建新闻模型
基于内容和主题特征的新闻推荐方案将新闻表示为一个三维的模型,包括主题特征向量,关键词权值和新闻时间,
文本是关于主题的概率分布,而主题又是词语上的概率分布。因此新闻可以表示为一组题特征向量,即:}
,向量中得每一维表示新闻在第i个主题的权值,m为主题个数。
2.2.4 新闻推荐生产
在获得用户的兴趣偏好后,需要计算用户兴趣和新闻内容间的匹配度来决定新闻是否为用户推荐,而仅仅依靠匹配度的计算来决定是否向用户推荐往往不足以使推荐系统的效果优异。由前文所述,用户的兴趣多样性决定了其偏好也是多样的,新闻的流行度和新颖度随着时间变化,这不同于其他系统的物品推荐(商品和电影),因此基于内容的个性化新闻推荐需要一个完整的、全面的对初始新闻推荐列表的处理过程,综合考虑时间、冗余及分类等因素,提升新闻的推荐准确率、多样性及新颖性。本节将介绍基于内容和主体特征的新闻推荐方案中新闻推荐生成的各个过程,包括匹配度的计算过程、对用户初始新闻推荐列表的冗余删除及过滤、主题分组和时效权值排序。3. 研究计划与安排
第1—3周:查阅相关文献资料,明确研究内容,了解研究所需知识与各项技能。确定方案,完成开题报告,书写摘要并完成相关英文文献翻译。
第4-6周:前期可行性研究,需求分析,进行系统的初步设计。
第7-12周:系统具体实现,主要完成代码的编写,调试以及功能的实现。
4. 参考文献(12篇以上)
[1] (美)玛若曼尼斯(marmanis, h. ), (美)巴宾寇(babenko,等.智能web算法[m]. 电子工业出版社, 2011.
[2] 张秀伟, 何克清, 王健,等. web服务个性化推荐研究综述[j]. 计算机工程与科学, 2013, 35(9):132-140.
[3] adomavicius g, tuzhilin a. personalization technologies[j].communications of the acm, 2005, 48:83-90.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。