汉语多层次语篇分析理论方法研究与应用

批准号:
61333018
项目类别:
重点项目
资助金额:
300.0 万元
负责人:
宗成庆
依托单位:
学科分类:
F0305.生物、医学信息系统与技术
结题年份:
2018
批准年份:
2013
项目状态:
已结题
项目参与者:
王厚峰、张民、詹卫东、孔芳、陈钰枫、周玉、刘康、李中国、汪梦翔
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
建立在词汇、短语和句子级分析基础上的语篇分析是目前自然语言处理研究的核心问题之一。与英语的篇章理论与方法研究相比,关于汉语篇章级分析的理论方法研究相对滞后,在自然语言处理领域才刚刚起步。本项目将充分借鉴国内外已有的理论方法,针对汉语自身的特点和规律,建立一套适用于汉语篇章结构描述和语义分析的、可计算的理论体系,并将其应用于具体系统。主要研究内容包括:①提出汉语篇章结构关系分析、话题分析和衔接性、连贯性描述的多层次语篇分析的理论方法和模型;②基于所提出的理论模型,建立汉语篇章的多层次标注规范,并构建大规模汉语篇章标注语料库;③研究实现篇章分析的核心算法;④将篇章分析技术应用于机器翻译和问答系统。本研究工作对于丰富和发展计算语言学和中文信息处理研究,推动相关技术的发展,具有重要的科学意义和应用价值。
英文摘要
Based on the multi-level analysis of lexicon, phrase and sentence, discourse analysis has become one of the key issues in natural language processing research in recent years. However, Chinese discourse analysis is still in its very early stage, significantly lagging behind that of English in both theory and methodology. This project aims to establish the computational theory for the analysis of logical structure and semantics of Chinese discourse by leveraging on the state-of-the-art and apply the research results to practical applications empirically. In particular, the project focuses on the following researches: .1) propose the theory and model for the analysis of Chinese discourse logical structure, topic structure, cohesion and coherence; 2) based on the proposed theory, develop the annotation scheme and build up a large scale of Chinese discourse-annotated corpus; 3) study and implement the core algorithms of Chinese discourse analysis; 4) apply the research results to machine translation and question answering. .We believe that the research achievements from this proposal have great scientific significance and application value to Chinese information processing and Chinese computational linguistics by advancing the state-of-the-art and filling up the research gaps of automatic analysis and application of Chinese discourse.
本项目在深入分析汉语篇章结构特点的基础上,提出了多视角、多层次的汉语篇章分析方法,建立了一套实用的描述汉语篇章衔接性和连贯性的理论方法,研究制订了一套汉语篇章结构表示方法和标注规范,提出了分阶段的移进-规约篇章关系分析算法,有效提升了篇章关系分析的效率和准确率,实现了一套汉语篇章分析工具和实验平台。标注完成了一批用于汉语篇章理论研究和应用系统实现的篇章语料,已授权给数十家国内外研究机构和企业使用。项目执行期间,发表论文58篇,出版学术专著一部,申请发明专利8项,获得软件著作权登记9个,组织学术会议4个,培养了一批高水平的专门技术人才,获得国家科技进步奖二等奖等多个奖励和荣誉。完成了项目任务,达到了预期的目标。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2016
期刊:计算机学报
影响因子:--
作者:王少楠;宗成庆
通讯作者:宗成庆
DOI:--
发表时间:2016
期刊:软件学报
影响因子:--
作者:吴惠甲;张家俊;宗成庆
通讯作者:宗成庆
Implicit Discourse Relation Recognition for English and Chinese with Multiview Modeling and Effective Representation Learning
基于多视图建模和有效表征学习的英汉隐式话语关系识别
DOI:10.1145/3028772
发表时间:2017-03
期刊:ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING
影响因子:2
作者:Li Haoran;Zhang Jiajun;Zong Chengqing
通讯作者:Zong Chengqing
DOI:--
发表时间:2015
期刊:IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)
影响因子:--
作者:Mei Tu;Yu Zhou;Chengqing Zong
通讯作者:Chengqing Zong
DOI:--
发表时间:2015
期刊:ACM Transactions on Asian Language and Low-Resource Language Information Processing
影响因子:--
作者:Xiaoqing Li;Chengqing Zong;Keh-Yih Su
通讯作者:Keh-Yih Su
大规模多语种多模态神经机器翻译关键技术研究
- 批准号:62336008
- 项目类别:重点项目
- 资助金额:233.00万元
- 批准年份:2023
- 负责人:宗成庆
- 依托单位:
人工智能学术研讨会
- 批准号:--
- 项目类别:国际(地区)合作与交流项目
- 资助金额:1.96万元
- 批准年份:2019
- 负责人:宗成庆
- 依托单位:
基于知识的智能机器翻译方法研究
- 批准号:U1836221
- 项目类别:联合基金项目
- 资助金额:260.0万元
- 批准年份:2018
- 负责人:宗成庆
- 依托单位:
基于语言理解的机器翻译方法研究
- 批准号:60975053
- 项目类别:面上项目
- 资助金额:33.0万元
- 批准年份:2009
- 负责人:宗成庆
- 依托单位:
基于话语理解的交互式口语翻译方法研究
- 批准号:60575043
- 项目类别:面上项目
- 资助金额:26.0万元
- 批准年份:2005
- 负责人:宗成庆
- 依托单位:
基于对话内容的高鲁棒性信息提取方法研究
- 批准号:60375018
- 项目类别:面上项目
- 资助金额:23.0万元
- 批准年份:2003
- 负责人:宗成庆
- 依托单位:
基于儿童心理分析的图解式汉语口语自动解析方法研究
- 批准号:60175012
- 项目类别:面上项目
- 资助金额:18.0万元
- 批准年份:2001
- 负责人:宗成庆
- 依托单位:
国内基金
海外基金
