基于概率图模型的海量评分数据分析与用户行为建模

批准号:
61472345
项目类别:
面上项目
资助金额:
80.0 万元
负责人:
岳昆
依托单位:
学科分类:
F0202.系统软件、数据库与工业软件
结题年份:
2018
批准年份:
2014
项目状态:
已结题
项目参与者:
刘惟一、张骥先、吴鸿、张志坚、段亮、方启宇、徐娟、汪正嘉
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
随着Web2.0技术的迅速发展,用户产生的数据急剧增长,电子商务和社会网应用中的用户评分数据富含了用户的行为信息,为用户行为建模的研究提供了依据。海量的用户评分数据分析和行为建模关键技术,是用户行为分析和预测、也是数据密集型计算在社会数据分析方面亟待解决的问题。本项目从海量的用户评分数据出发,用隐变量刻画用户的行为,以带隐变量的贝叶斯网(隐变量模型)作为描述用户行为的理论基础、不确定性知识表示和推理的基本框架,以MapReduce作为海量数据处理的技术手段,重点研究描述用户行为的时序隐变量模型构建、分布式存储、增量修改,以及面向评分预测和异常行为检测等用户行为分析典型应用的概率推理查询处理方法,对新方法进行理论分析和实验测试,并开发相应的软件系统。研究成果将为用户行为数据分析提供有效的支撑技术,为动态演变的用户行为建模提供新的思路,具有重要的理论意义和应用价值。
英文摘要
With the rapid development of Web2.0, user-generated data are increased rapidly. User rating data in e-commerce and social network applications include user behaviors and provide the basis for user behavior modeling. The underlying techniques for analyzing massive user rating data and modeling user behaviors is the critical problem of user behavior analysis and prediction, as well as that of data-intensive based social data analysis. In this project, we start from the massive user rating data, and describe user behaviors by a latent variable. We adopt the BN with latent variables (latent variable model) as the theoretical basis for describing user behaviors, and the basic framework for representing and inferring uncertain knowledge. Adopting MapReduce as the technical means for processing massive data, we focus on the construction, distributed storage and incremental revision of the time-series latent variable model used to describe user behaviors, as well as the inference query processing oriented to the classical applications of user behavior analysis, such as rating prediction and abnormal behavior detection. We further make theoretical analysis and empirical tests on the proposed methods and develop the corresponding software system. The research findings of this project will provide effective techniques for user behavior data analysis, and novel ideas for modeling the evolving user behaviors, which is valuable in both theoretical and practical perspectives.
通过对项目中关键问题的深入研究,取得了基于隐变量模型的评分数据分析和用户行为建模的阶段性研究结果,对照项目申请书和计划任务书中,已按时完成了预期的目标和任务。在理论方法与支撑技术方面,以概率图模型作为评分数据中相关属性之间相互依赖关系及其不确定性表示和推理的基本知识框架,以隐变量表示用户偏好,针对数据的海量性与分布式、动态性与不确定性等特点,以支持高效准确的用户偏好建模、关联查询和个性化服务为目标,从语义及约束的表示、模型结构构建及参数学习、知识发现及知识融合等方面,扩展现有方法,基于数据密集型和计算密集型计算平台与技术,提出了数据清洗与获取、模型构建与优化、个性化服务与知识融合方法,将模型的构建与概率推理方法用于Web服务数据和社交媒体数据分析。通过理论分析和实验测试,验证了方法的高效性、正确性和可用性,也设计并开发了相应的实验平台和软件系统。.作为这些研究结果的体现,本项目资助在本领域国内外重要期刊及会议上发表了40篇学术论文(其中SCI收录及源刊13篇,EI收录及源刊31篇次;在World Scientific出版社出版专著1部,参编译著1部;申请发明专利12项(其中授权3项,公开或受理9项),申请获得计算机软件著作权登记6项;获得省部级人才计划或奖励3项。依托本项目的研究,培养青年教师5名,博士生毕业3名、在读6名,硕士生毕业39名、在读21名。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Representing and processing lineages over uncertain data based on the Bayesian network
基于贝叶斯网络的不确定数据的谱系表示和处理
DOI:10.1016/j.asoc.2015.07.047
发表时间:2015
期刊:Applied Soft Computing
影响因子:8.7
作者:Yue Kun;Wu Hao;Liu Weiyi;Zhu Yunlei
通讯作者:Zhu Yunlei
Discovering admissible Web services with uncertain QoS
发现具有不确定 QoS 的可接受的 Web 服务
DOI:10.1007/s11704-014-4059-9
发表时间:2015
期刊:Frontiers of Computer Science
影响因子:4.2
作者:Fu Xiaodong;Yue Kun;Liu Li;Zou Ping;Feng Yong
通讯作者:Feng Yong
Measuring performance degradation of virtual machines based on the Bayesian network with hidden variables
基于隐变量贝叶斯网络测量虚拟机性能下降
DOI:10.1002/dac.3732
发表时间:2018
期刊:International Journal of Communication Systems
影响因子:2.1
作者:Hao Jia;Zhang Binbin;Yue Kun;Wu Hao;Zhang Jixian
通讯作者:Zhang Jixian
DOI:10.1142/s0218213016500111
发表时间:2016
期刊:International Journal on Artificial Intelligence Tools
影响因子:1.1
作者:Liu Weiyi;Yue Kun;Fu Xiaodong;Yin Zidu;Li Jin
通讯作者:Li Jin
Collaborative Topic Regression with social trust ensemble for recommendation in social media systems
与社会信任集成的协作主题回归,用于社交媒体系统中的推荐
DOI:10.1016/j.knosys.2016.01.011
发表时间:2016-04
期刊:Knowledge-Based Systems
影响因子:8.8
作者:Hao Wu;Kun Yue;Yijian Pei;Bo Li;Yiji Zhao;Fan Dong
通讯作者:Fan Dong
大数据环境下的云南边疆民族文化计算支撑技术与实证研究
- 批准号:U1802271
- 项目类别:联合基金项目
- 资助金额:100.0万元
- 批准年份:2018
- 负责人:岳昆
- 依托单位:
基于贝叶斯网的不确定性数据世系分析
- 批准号:61063009
- 项目类别:地区科学基金项目
- 资助金额:23.0万元
- 批准年份:2010
- 负责人:岳昆
- 依托单位:
国内基金
海外基金
