汉英篇章衔接对齐资源构建与分析研究

批准号:
61502149
项目类别:
青年科学基金项目
资助金额:
21.0 万元
负责人:
李艳翠
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2018
批准年份:
2015
项目状态:
已结题
项目参与者:
贡正仙、赵颖、李学勇、冯洪玉、苗国义、金松林、郑颖、王中卿、朱珠
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少,从而影响了融合衔接信息的机器翻译等相关应用。本项目旨在创建汉英篇章衔接对齐资源,研究衔接自动对齐分析技术,并将此应用于融合衔接信息的机器翻译。首先,研究汉英篇章衔接对齐标注策略,建立包含指代、省略和连接对齐信息的汉英篇章衔接对齐资源;其次,基于所建资源,结合汉英衔接特点,采取不同的分析策略和处理方法,实现汉英衔接对齐分析平台;最后,将衔接信息融入机器翻译系统中,从提高机器翻译性能和改善评测两方面考察衔接信息的作用。本项目开展的研究工作对于推进汉英篇章语义分析研究具有重要的意义。
英文摘要
Discourse cohesion analysis plays a critical role in discourse understanding, in which there exist differences in cohesion between English and Chinese, including anaphor, ellipsis and connective. However, there are few studies in discourse cohesion alignment between Chinese and English, due to the lack of publicly available parallel resource annotated with discourse cohesion on both language sides. Consequently, few studies have been seen in applying discourse cohesion in natural language process tasks, such as machine translation...To this end, this project aims to create a Chinese-English parallel resource with discourse cohesion annotation on both sides and their alignment. This is done in three-level levels. First, we explore proper strategies in annotating discourse cohesion, including anaphor, ellipsis, and connectives. Second, we propose targeted approach to automatically recognize anaphor, ellipses, and connectives in both Chinese and English, and consequently learn the alignment of cohesion between the two languages. Third and finally, we propose several approaches to effectively apply bilingual discourse cohesion in statistical machine translation (SMT) and SMT evaluation...To sum up, The project has important significance for promoting discourse semantic analysis between English and Chinese.
篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。英语和汉语在指代、省略和连接等主要衔接方式上存在差异,现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少, 从而影响了融合衔接信息的机器翻译等相关应用。本项目的研究成果包括:. 1)提出汉英篇章衔接对齐语料库标注策略,给出了语料标注方案,开发了标注工具,完成了包含子句、指代、省略和连接对齐信息的200个平行文档的汉英篇章衔接对齐语料库标注,标注质量良好。. 2)基于所建资源,结合汉英衔接方式的特点,采取不同的分析策略和处理方法,进行了子句、连接词和指代的分析研究,结果表明本语料库是可计算的。. 3)将衔接信息融入机器翻译系统,初步实验表明衔接信息可提高机器翻译性能。. 本项目工作对于推进汉英篇章语义分析研究具有重要的意义。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2016
期刊:河南科技学院学报(自然科学版)
影响因子:--
作者:王全蕊;李艳翠
通讯作者:李艳翠
DOI:--
发表时间:2018
期刊:河南科技学院学报(自然科学版)
影响因子:--
作者:刘杰;苏慧哲;李艳翠
通讯作者:李艳翠
DOI:--
发表时间:2018
期刊:中文信息学报
影响因子:--
作者:郑杰;孔芳;周国栋
通讯作者:周国栋
DOI:--
发表时间:2018
期刊:中文信息学报
影响因子:--
作者:冯文贺;郭海芳;刘涛
通讯作者:刘涛
DOI:--
发表时间:2007
期刊:Revista de la Facultad de Ingeniería U.C.V.
影响因子:--
作者:孙静;李艳翠
通讯作者:李艳翠
国内基金
海外基金
