课题基金基金详情
汉语篇章连贯性分析:话题结构、逻辑语义结构及其联合学习研究
结题报告
批准号:
61472264
项目类别:
面上项目
资助金额:
81.0 万元
负责人:
孔芳
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2018
批准年份:
2014
项目状态:
已结题
项目参与者:
钱培德、奚雪峰、钱忠、李生、丁彬、王剑、黄学华
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
与词法、句法分析相比,篇章分析研究相对滞后,特别是,汉语篇章分析的研究处于起步阶段,由于尚未形成成熟的理论体系,资源极为匮乏,因此相关计算模型的研究受到了严重的制约。篇章逻辑语义结构和话题结构从不同视角描述了篇章的连贯性,本项目将从汉语篇章逻辑语义结构和话题结构出发,基于已有的篇章分析和话题结构理论,重点研究汉语篇章的连贯性。主要的研究内容包括:1)提出并实现融合多种信息的隐式篇章逻辑关系识别方法,构建高性能的端到端的篇章逻辑语义分析平台,并基于该平台进行基于ILP和结构化感知器的全局优化研究;2)提出并实现基于话题-评述关系理论的微观话题结构分析方法,并在此基础上进行基于话题链的宏观话题识别研究;3)从连贯性视角分析汉语篇章逻辑语义结构和话题结构的关联性,并基于此提出并实现基于句法和谓词论元结构的汉语篇章逻辑语义结构和话题结果的联合学习方法。
英文摘要
The research on discourse analysis lags behind morphological and syntactic analysis. In particular, the research on Chinese discourse analysis just started. The lack of effective theoretical methodologies and corpora severely restricts the research on the computational model of Chinese discourse analysis. Logical semantic structure and topic structure describes discourse coherence from different perspective. This project mainly focuses on Chinese discourse coherence based on Chinese logical semantic structure and topic structure analysis. The project addresses Chinese discourse coherence from following aspects: 1) Propose an algorithm for implicit discourse relation identification combining multi-level knowledge, and implement an effective end-to-end Chinese logical semantic structure parser. Based on this platform, research on global optimization via ILP and structured perception framework. 2) Design and implement a high-performance algorithm for micro-topic structure analysis based on the theory of topic-comments relationship. Then research on macro-topic identification based on the micro-topic chains. 3) Analyze the relationship between logical semantic structure and topic structure from discourse coherence perspective. Propose and implement the joint learning of logical semantic structure and topic structure analysis based on syntactic and predict-argument structure.
词法、句法研究日趋成熟,篇章分析研究相对滞后,已经成为篇章理解核心要解决的关键问题之一。本项目从汉语篇章逻辑语义结构和话题结构的统一表示出发,基于已有的篇章分析和话题结构理论,重点研究汉语篇章的连贯性。主要完成了以下几个工作:.1)构建了端到端的汉语篇章逻辑语义结构解析器:从多模块级联构建完整的解析器,到基于转移系统实现多模块间的联合学习,最终形成了完整的高性能的逻辑语义结构解析器;.2)服务于逻辑语义结构和话题结构的联合学习,构建了基于主述位理论的话题结构资源库,并在此基础上进行了篇章视角的零指代的标注,为后续话题结构的可计算研究,以及篇章结构多层次联合学习奠定了语料基础;.3)构建了端到端的汉语篇章话题结构解析器:以各模块级联的方式构建了完整的解析器,包括主述位识别模块,话题推进识别和话题链识别模块等;.4)以汉语零指代为媒介进行汉语篇章逻辑语义结构和话题结构的联合学习:主述位识别的同时进行隐式主述位的确定,隐式主述位同时就是篇章中的零元素;这些零元素形成的指代链的构建,一方面有助于话题链的生成,另一方面对于篇章逻辑语义结构的确立意义重大;我们将篇章逻辑语义结构的构建过程看成是对分割点次序的排序过程,借助零指代的方式进行排序,进而完成逻辑语义结构的构建;逻辑语义结构的确定又决定了核心信息,即话题序列的形成,并最终构建形成话题链。.重要的成果主要包括:.1)构建了包含篇章视角零元素信息的汉语篇章逻辑语义结构和话题结构的统一语料库;.2)构建了高性能的汉语逻辑语义结构解析器;.3)构建了高性能的汉语话题结构解析器;.4)构建了基于主述位理论的汉语篇章联合解析器,能完成零元素识别、逻辑语义结构生成和话题链识别。.构建的资源库为后续汉语篇章多层次联合学习奠定了基础,形成的三个平台可为自然语言处理的各类应用提供多视角的汉语篇章信息,以帮助各类应用提升其性能。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2018
期刊:中文信息学报
影响因子:--
作者:陆震寰;孔芳;周国栋
通讯作者:周国栋
DOI:--
发表时间:2017
期刊:计算机学报
影响因子:--
作者:奚雪峰;孙庆英;周国栋
通讯作者:周国栋
DOI:--
发表时间:2016
期刊:计算机工程
影响因子:--
作者:黄学华;孔芳;周国栋
通讯作者:周国栋
DOI:--
发表时间:2018
期刊:北京大学学报 自然科学版
影响因子:--
作者:盛晨;孔芳;周国栋
通讯作者:周国栋
DOI:10.13209/j.0479-8023.2017.038
发表时间:2016
期刊:北京大学学报(自然科学版)
影响因子:--
作者:杨紫怡;贡正仙;孔芳;周国栋
通讯作者:周国栋
面向交互场景的话题结构解析
  • 批准号:
    --
  • 项目类别:
    面上项目
  • 资助金额:
    53万元
  • 批准年份:
    2022
  • 负责人:
    孔芳
  • 依托单位:
面向篇章信息性的汉语篇章结构多层次联合分析研究
  • 批准号:
    61876118
  • 项目类别:
    面上项目
  • 资助金额:
    62.0万元
  • 批准年份:
    2018
  • 负责人:
    孔芳
  • 依托单位:
汉语篇章衔接性分析:指代、省略及其消歧研究
  • 批准号:
    61272257
  • 项目类别:
    面上项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2012
  • 负责人:
    孔芳
  • 依托单位:
基于句法结构和语义信息的指代消解研究
  • 批准号:
    61003153
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2010
  • 负责人:
    孔芳
  • 依托单位:
国内基金
海外基金