课题基金基金详情
基于文本观点挖掘的多对象评级理论与方法研究
结题报告
批准号:
61175067
项目类别:
面上项目
资助金额:
60.0 万元
负责人:
王素格
依托单位:
学科分类:
F03.自动化
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
李茹、谷波、李艳红、李顺勇、暴艳、张梦笑、张杰、李亚红、薛宾
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
本项目面向观点挖掘领域多对象/方面评级的现实迫切需求,在建立大规模真实产品评论文本语料库与本体知识库的基础上,借助于计算语言学、统计数据建模、机器学习等理论与方法,系统地开展多对象/方面评级的建模、分析与计算的新理论与关键技术研究。具体内容包括:(1)基于多层次语言粒度的观点句抽取;(2)基于上下文语义特征的观点句-对象/方面共指关系挖掘;(3)基于汉语框架网的比较句语义角色标注及其情感倾向分析;(4)基于潜在分析技术的多对象/方面评级;(5)基于评论文本时序性的对象/方面评级演化趋势分析。并研制一个基于Web的面向汽车产品评论的多品牌评级系统。本项研究不仅在解决基于观点挖掘的多对象评级领域中的基础理论、关键技术问题方面有着重要的科学意义,同时也在企业产品信誉分析、大众消费行为指导等方面具有潜在应用价值。
英文摘要
本项目面向观点挖掘领域多对象/方面评级的现实需求,在建立大规模真实产品评论语料库与本体知识库的基础上,借助于计算语言学、统计数据建模、机器学习等理论与方法,系统地开展多对象/方面评级的建模、分析与计算的新理论与关键技术研究。主要研究内容与创新点包括:在不同语言粒度上的观点句抽取;基于上下文语义特征的共指关系缺省项识别;基于序列模式的比较句识别与比较要素抽取;利用依存语法与语义隐式关系,实现了对象和方面的抽取,建立了对象方面的评级模型。探索了时序性文本的情感演化方法。构建了多个应用系统,建立了丰富的语料库资源和词汇资源。.面向观点句识别,采用字与词的语言粒度表示,提出了增强字向量和BootStrapping集成学习方法。使用词法和依存句法融合特征,提出了高效的共指关系缺省项识别方法和比较句缺省观点对象识别与补充方法。根据汉语比较句的特点,构建了比较模式挖掘算法,实现了比较句识别及要素抽取。建立产品性能的非完备信息系统,通过特征降维处理,实现了产品对象情感评级;提出了基于观点袋模型和语言学规则的多级情感分类方法。针对汽车产品评论文本具有多方面性能,提出基于多标记学习的汽车评论文本多方面性能识别方法;利用主动学习方法,实现了汽车评论的情感倾向演化分析。基于期望水平和两个簇分布的不相似性度量的近似密度函数,提出了一种簇分布差异阈值的选择方法,进而建立了概念漂移检测算法。针对评论文本情感分析具有领域依赖性、非平衡性和语言多样性,综合运用SMOTE和BootStrapping方法,提出了一种跨领域文本情感分类的目标领域数据标注方法;利用评论文本的分布密度,提出了BRC裁剪算法,实现了非平衡样本的平衡化处理;利用多种语言自身表达的独特性和语言间的关联性,提出了策略融合的跨语言文本情感倾向判别框架。建立了COAE2012-COAE2013比较句识别、比较要素抽取的评测语料库,为比较观点挖掘研究提供了公共数据集。建立了COAE2014-COAE2015观点要素识别语料库,为对象/方面的细粒度观点要素抽取的相关研究提供了公共研究数据集,有力地支持了文本情感分析技术的发展。.利用以上研究成果,构建了基于Web 评论文本的企业产品分析系统、文本情感分析技术与资源开放平台等一系列软件,为文本情感分析的相关应用提供了软件支持。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2016
期刊:计算机应用
影响因子:--
作者:陈鑫;王素格;廖健
通讯作者:廖健
DOI:10.1155/2014/359626
发表时间:2014
期刊:TheScientificWorldJournal
影响因子:--
作者:Li H;Li D;Zhai Y;Wang S;Zhang J
通讯作者:Zhang J
DOI:--
发表时间:2015
期刊:计算机科学
影响因子:--
作者:张晶;李德玉;王素格;李华
通讯作者:李华
DOI:--
发表时间:--
期刊:计算机科学与工程
影响因子:--
作者:张晶;李德玉;王素格
通讯作者:王素格
DOI:--
发表时间:2013
期刊:电脑开发与应用
影响因子:--
作者:薛宾;王素格;张鹏;廖建
通讯作者:廖建
篇章级事件情感分析关键技术研究
  • 批准号:
    62376143
  • 项目类别:
    面上项目
  • 资助金额:
    49万元
  • 批准年份:
    2023
  • 负责人:
    王素格
  • 依托单位:
面向散文阅读理解的文本情感分析关键技术研究
  • 批准号:
    --
  • 项目类别:
    面上项目
  • 资助金额:
    59万元
  • 批准年份:
    2020
  • 负责人:
    王素格
  • 依托单位:
面向产品评论的隐式情感建模理论与方法研究
  • 批准号:
    61573231
  • 项目类别:
    面上项目
  • 资助金额:
    64.0万元
  • 批准年份:
    2015
  • 负责人:
    王素格
  • 依托单位:
基于多层次语言粒度的文本情感分类研究
  • 批准号:
    60875040
  • 项目类别:
    面上项目
  • 资助金额:
    30.0万元
  • 批准年份:
    2008
  • 负责人:
    王素格
  • 依托单位:
国内基金
海外基金