全文总字数:3542字
1. 研究目的与意义(文献综述)
随着移动互联网蓬勃发展和流量时代的到来,网络视频已经成为互联网中重要的信息资源,对于视频观看用户,他们希望能够获得自身感兴趣的视频资源,而对于视频平台而言,他们更希望感知用户的兴趣所在,抓住用户流量。因此,一个高效的视频推荐系统显得格外重要。
传统的视频推荐系统通常会采用基于内容过滤的或者基于协同过滤的推荐算法。其中内容过滤算法是一种较为常见的过滤算法,通常用于信息过滤领域,是一种较为基础的过滤方式。基于内容推荐算法是通过提取用户行为数据,对数据进行清理和处理,拆分出用户兴趣特征,然后采用加权的方式,对用户较为感兴趣的项目赋予比较大的权重。这种推荐方式在包含文本信息的推荐系统中使用较为广泛,如新闻、职业推荐系统等,但是由于其主要针对文本信息进行推荐,内容单一,对于视频等媒体的推荐只能靠视频文本标签,而文本标签与视频内容可能存在一定的不匹配现象,因此该算法在推荐精度上存在一定的问题。
协同过滤(collaborative filtering)算法,因其不同的实现方法可被划分为以下两类:基于item的协同过滤和基于user的协同过滤。基于item的协同过滤认为用户如果喜欢一个物品,那么也喜欢和这个物品相似的物品;而基于user的协同过滤认为用户如果喜欢一个物品,那么和这个用户兴趣相似的用户也会喜欢这个物品。无论哪种方法,都是基于高度稀疏的user-item评分矩阵去预测用户不曾打分的部分。这种限制使得协同过滤只能针对矩阵内有效,对于任意一个没有用户交互记录的新视频是无能为力的,这正是冷启动问题。此外,由于视频总数和用户总数都很巨大,评分矩阵势必是非常稀疏的,缺乏可以利用的信息,使得推荐效果不尽如人意。
2. 研究的基本内容与方案
本课题旨在从富文本、音频及画面三个方面着手并结合用户历史评分记录,提出并实现一种基于多模态视频内容的推荐算法。
(1)富文本。目前网络上有一种新型的电影数据库网站,他们会及时收集并更新电影的属性信息,诸如类别、国家、导演等,这类网站的代表有“imdb”和“豆瓣”。由于一部电影自上映以来其属性信息是确定的,则可以被视为一种特征标签,且其它电影也有可能拥有相同的标签。我们称这些标签为富文本信息。
(2)音频特征。对于音频特征,本文尝试使用mfcc(mel-frequency cepstral coefficients)来捕获视频中的音轨信息,提取音频帧的mfcc特征。fv(fisher vector)是基于高斯分布的聚类算法,常被用于图像、文本等的降维,本文利用fv对mfcc特征重新编码,生成相应的音频特征向量。
3. 研究计划与安排
(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2020/5/1—2020/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1] zhang, f., yuan, n. j.,lian, d., xie, x., ma, w. y. (2016, august). collaborative knowledge baseembedding for recommender systems. in proceedings of the 22nd acm sigkdd internationalconference on knowledge discovery and data mining (pp. 353-362).
[2] yue, l., sun, x. x.,gao, w. z., feng, g. z., zhang, b. z. (2018). multiple auxiliaryinformation based deep model for collaborative filtering. journal ofcomputer science and technology, 33(4), 668-681.
[3] he, x., liao, l., zhang,h., nie, l., hu, x., chua, t. s. (2017, april). neural collaborativefiltering. in proceedings of the 26th international conference on worldwide web (pp. 173-182).
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。