基于多源语义表示学习的社交媒体文本属性情感分类研究
结题报告
批准号:
61772135
项目类别:
面上项目
资助金额:
16.0 万元
负责人:
廖祥文
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2018
批准年份:
2017
项目状态:
已结题
项目参与者:
黄锦辉、吴运兵、冯沛璋、林嘉雯、杨定达、谢媛媛、刘德元、张凌鹰、吴晓静
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
属性情感分类是社交媒体文本情感分析与挖掘领域的重要研究问题。现有方法主要利用文本内部特征构建分类模型,由于文本包含的语义信息有限,导致分类性能受限。考虑到社交媒体中的用户交互信息以及开放知识库的属性知识可以提供更多语义知识来源,本项目拟开展基于多源语义表示学习的社交媒体文本属性情感分类研究。具体包括:利用文本结构与情感信息进行注意力机制下的表示学习,研究基于上下文语境的文本情感语义表示方法;通过异质网络节点嵌入模拟面向用户、内容和属性,研究融合用户交互信息的文本情感语义表示方法;通过多源约束下的知识表示对属性进行情感推理与消歧,研究融合开放知识库的文本情感语义表示方法;应用端到端的学习机制,实现文本、用户与属性知识的统一语义表示,研究基于多源语义表示的属性情感分类方法。在此基础上,构建面向证券领域的情感分类示范应用。本研究将推动社交媒体文本情感分析的基础研究,也为社交媒体相关应用提供借鉴。
英文摘要
Aspect-based sentiment classification is an importance topic in sentiment analysis, opinion mining and social media analysis. Recently, researchers focus on text features and text classification models. However, the confined semantic information from the text limits the performance of classifier. In practice, the interactive information between users in social media and the knowledge of aspect from knowledge base will provide more semantic information. In this project, we aim to use multi-source representation learning to improve aspect-based sentiment analysis in social media. Firstly, we will utilize syntactic structure and sentiment information by attention mechanism to map the text into low dimensional vector space in order to represent the text based on the context. Then, we will introduce user interactive information into representation learning by heterogeneous network embedding. In the knowledge representation, we plan to use multi-source restricted knowledge representation to learn the representation of aspect and introduce the aspect level knowledge representation into sentiment analysis by attention mechanism. Finally, we will design an End-to-End architecture to map the text, user and aspect knowledge into an unified representation for sentiment analysis in social media. The result of our work will improve the research of sentiment analysis in social media, and it will be also implemented in practical applications such as financial prediction by sentiment analysis.
本项目从“文本-用户-属性知识”三个层面出发,建立融合“文本-用户-属性知识”的统一语义表示学习框架,开展基于多源语义表示学习的社交媒体文本属性情感分类研究,主要包括:首先,在文档表示方面,充分考虑视角与上下文之间的关系、上下文中不同词语之间的语义联系、词序信息等,开展了基于上下文语境的文本情感语义表示方法和基于深度学习的视角级文本情感分类两方面研究。其次,在知识表示方面,根据上下文将词汇进行知识、概念层面的抽象,并在语义层面考虑词汇之间的语义联系,设计了融合文本概念化与网络表示的“文本-知识”语义表示。然后,在多源语义融合方面,利用节点在网络中的高阶相似性、节点结构相似性和属性信息,设计融合“文本-节点关系-属性信息”的统一语义表示,并应用于情感属性多标签分类。接着,研究结合表示学习和迁移学习的跨领域情感分类方法,有效缓解了若干领域缺乏情感标注样本的问题。最后,集成上述研究成果设计构建面向证券领域的情感分类原型系统,并应用于产学研项目“大数据驱动的金融智能服务平台”,取得了较好的示范应用效果。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1016/j.physa.2018.02.128
发表时间:2018-08
期刊:Physica A: Statistical Mechanics and its Applications
影响因子:--
作者:Dingda Yang;Xiangwen Liao;Huawei Shen;Xueqi Cheng;Guolong Chen
通讯作者:Dingda Yang;Xiangwen Liao;Huawei Shen;Xueqi Cheng;Guolong Chen
DOI:--
发表时间:2018
期刊:山东大学学报(理学版)
影响因子:--
作者:廖祥文;张凌鹰;魏晶晶;桂林;程学旗
通讯作者:程学旗
DOI:--
发表时间:2018
期刊:计算机学报
影响因子:--
作者:廖祥文;陈泽泽;桂林;程学旗;陈国龙
通讯作者:陈国龙
DOI:--
发表时间:2018
期刊:中国科学: 信息科学
影响因子:--
作者:廖祥文;黄知;杨定达;程学旗;陈国龙
通讯作者:陈国龙
Recommending Mobile Microblog Users via a Tensor Factorization Based on User Cluster Approach
基于用户聚类方法的张量分解推荐移动微博用户
DOI:10.1155/2018/9434239
发表时间:2018-10
期刊:Wireless Communications and Mobile Computing
影响因子:--
作者:廖祥文;张凌鹰;魏晶晶;杨定达;陈国龙
通讯作者:陈国龙
基于认知理解的个性化共情回复生成关键技术研究
  • 批准号:
    62476060
  • 项目类别:
    面上项目
  • 资助金额:
    50万元
  • 批准年份:
    2024
  • 负责人:
    廖祥文
  • 依托单位:
面向观点型机器阅读理解的关键技术研究
  • 批准号:
    61976054
  • 项目类别:
    面上项目
  • 资助金额:
    58.0万元
  • 批准年份:
    2019
  • 负责人:
    廖祥文
  • 依托单位:
融合用户社会影响力和用户个性化特征的社会媒介倾向性检索研究
  • 批准号:
    61300105
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万元
  • 批准年份:
    2013
  • 负责人:
    廖祥文
  • 依托单位:
国内基金
海外基金