稀疏表达下社会化正则方法与低秩分解推荐模型的研究-猫眼课题宝

权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

结题报告

批准号：

71502125

项目类别：

青年科学基金项目

资助金额：

18.5 万元

负责人：

郁雪

依托单位：

天津大学

学科分类：

G0209.商务智能与数字商务

结题年份：

2018

批准年份：

2015

项目状态：

已结题

项目参与者：

王赞、杨斯博、胡旭、赵晓彬、樊向宇

关键词：

社会网络分析低秩矩阵分解协同过滤正则化推荐系统

国基评审专家1V1指导中标率高出同行96.8%

中文摘要

数据缺失下的矩阵低秩分解是协同过滤推荐领域中一个具有挑战性的课题，本项目将用户的社会网络信息引入矩阵低秩分解模型，在研究Web社会网络信息的关联用户信任度问题的基础上，提出了新的社会化正则方法，引导模型学习关联用户空间的潜在低秩结构，理论上具有很好的解释性，为个性化推荐技术研究提供新思路。内容包括：基于社会网络分析的理论挖掘用户之间潜在联系，重新定义关联用户之间信任的描述方法，研究信任传播算法和构建有效的信任测度模型；提出基于社会网络用户信任关系的低秩矩阵分解模型，利用新的先验知识来构造正则项惩罚系数，引导模型向真实评分逼近；研究大规模数据下基于聚类的局部低秩矩阵分解模型，采用遗传聚类方法对原始空间进行划分，在每个子空间上构造新的社会化正则项学习该子空间的潜在低秩结构；最后结合Web社会网络应用进行实证研究，将所研究的方法应用于电子市场行为预测、Web社区推荐和荐和电子商务产品推荐等领域。

英文摘要

Low-rank matrix approximation in sparse representation is a big challenge in collaborative filtering recommendation area. This project will merge the social network feature data into the low-rank matrix factorization model in which we apply a new regularization method to learning the latent low-rank information within the related user space after exploring the latent relationship between users in social network. The new model aims to provide a new approach on recommendation research with good theoretical explanation. The main research details will include: to explore latent relationship between users based on SNA, redefine the influence factors of trust between related users in social network applications, improve the existed trust propagation algorithm and construct effective trust metric model; develop low-rank matrix factorizations model based on social relation data, propose novel regularizations with prior knowledge in order to handle low-rank approximation with good performance; research cluster-based low-rank matrix factorization in massive data sets, divide the original user space using Genetic-Kmeans algorithm and develop new regularizations to learn the latent structures within each sub-spaces; finally, to complete the empirical study with some real social network applications, and the research model and method will apply to practical areas such as user behavior predicting in electronic market、Web community recommendation and E-commerce item recommendation.

考虑到推荐系统中的在线用户和项目规模的快速增长，导致原始数据极度稀疏并含有大量噪声。现有的基于矩阵分解推荐模型在学习向量特征时极小化评分值的均方误差会导致模型的过度拟合而无法建立用户的真实兴趣。融合隐式信息增强预测的准确性已经成为了目前的主流思想，项目组将大规模高维数据所包含的社会化信息、隐式内容特征信息与低秩矩阵分解技术相结合，利用新的先验知识来构造正则项惩罚系数，优化机器学习过程，在提升预测模型的准确性和可扩展性等方面取得了一定的进展。项目组首先构建了社会网络信任度正则因子惩罚项，新的正则项由用户间的社会信任关系来引导，同时加强物品隐特征的约束，提出双重约束的矩阵分解推荐模型；为了体现了用户之间的兴趣差异性，提出一种基于用户内容偏好隐式反馈信息的矩阵分解模型，模型首先使用改进的基于搜索的遗传聚类算法对物品进行内容划分，然后在矩阵分解的目标函数中加入的新的内容偏好向量，该向量可视为用户对某特定类型物品的偏好而产生的对原偏好的偏差值，新模型在训练过程中体现出用户对内容偏好的自适应变化，能够更好的向真实评分逼近；考虑到社交信任关系的动态性对用户真实偏好的影响，提出了基于时间感知的社会化推荐模型，在新的模型中我们把时间感知因素作为对原用户隐向量的一个偏置向量，体现了最近时间内目标用户偏好的变化；探索了矩阵分解的并行计算方法，提出通过遗传聚类划分原始矩阵，分别在子空间上进行社会化矩阵分解的推荐模型，虽然取得了初步的实验结果，但是模型的维度约简优化方法，子空间上的约束惩罚项等细节还需要进一步深入研究；以上模型分别对3个真实数据集进行了实证研究，结果表明融合社交关联信息和物品隐式特征的推荐技术能够提高稀疏数据集上预测评分的准确性，而且时间感知的社会化推荐模型在可扩展性方面比目前主流的社会化推荐算法表现更加优秀，因此可以尝试应用在实际的推荐场景中。

期刊论文列表

专著列表

科研奖励列表

会议论文列表

专利列表

Improved Annealing-Genetic Algorithm for Test Case Prioritization

改进的测试用例优先级退火遗传算法

DOI：10.4149/cai_2017_3_705

发表时间：2017-06

期刊：

COMPUTING AND INFORMATICS

影响因子：0.7

作者：

Wang Zan;Zhao Xiaobin;Zou Yuguo;Yu Xue;Wang Zhenhua

通讯作者：Wang Zhenhua

A systematic survey on automated concurrency bug detection, exposing, avoidance, and fixing techniques

关于自动并发错误检测、暴露、避免和修复技术的系统调查

DOI：10.1007/s11219-017-9385-3

发表时间：2018-09

期刊：

Software Quality Journal

影响因子：1.9

作者：

Fu Haojie;Wang Zan;Chen Xiang;Fan Xiangyu

通讯作者：Fan Xiangyu

一种半监督集成跨项目软件缺陷预测方法

DOI：10.13328/j.cnki.jos.005228

发表时间：2017

期刊：

软件学报

影响因子：--

作者：

何吉元;孟昭鹏;陈翔;王赞;樊向宇

通讯作者：樊向宇

自动程序修复方法研究述评

DOI：--

发表时间：2017

期刊：

计算机学报

影响因子：--

作者：

王赞;郜健;陈翔;傅浩杰;樊向宇

通讯作者：樊向宇

Localizing multiple software faults based on evolution algorithm

基于进化算法的多软件故障定位

DOI：10.1016/j.jss.2018.02.001

发表时间：2018-05

期刊：

Journal of Systems and Software

影响因子：3.5

作者：

Zheng Yan;Wang Zan;Fan Xiangyu;Chen Xiang;Yang Zijiang

通讯作者：Yang Zijiang

国内基金

海外基金

会员权益说明：