RI: Large: Collaborative Research: Richer Representations for Machine Translation

RI:大型:协作研究:更丰富的机器翻译表示

基本信息

  • 批准号:
    0910992
  • 负责人:
  • 金额:
    $ 56万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2016-08-31
  • 项目状态:
    已结题

项目摘要

Research in machine translation of human languages has made substantial progress recently, and surface patterns gleaned automatically from online bilingual texts work remarkably well for some language pairs. However, for many language pairs, the output of even the best systems is garbled, ungrammatical, and difficult to interpret. Chinese-to-English systems need particular improvement, despite the importance of this language pair, while English-to-Chinese translation, equally important for communication between individuals, is rarely studied. This project develops methods for automatically learning correspondences between Chinese and English at a semantic rather than surface level, allowing machine translation to benefit from recent work in semantic analysis of text and natural language generation. One part of this work determines what types of semantic analysis of source language sentences can best inform a translation system, focusing on analyzing dropped arguments, co-reference links, and discourse relations between clauses. These linguistic phenomena must generally be made more explicit when translating from Chinese to English. A second part of the work integrates natural language generation into statistical machine translation, leveraging generation technology to determine sentence boundaries, ordering of constituents, and production of function words that translation systems tend to get wrong. A third part develops and compares algorithms for training and decoding machine translation models defined on semantic representations. All of this research exploits newly-developed linguistic resources for semantic analysis of both Chinese and English.The ultimate benefits of improved machine translation technology are easier access to information and easier communication between individuals. This in turn leads to increased opportunities for trade, as well as better understanding between cultures. This project's systems for both Chinese-to-English and English-to-Chinese are developed with the expectation that the approaches will be applied to other language pairs in the future.
近年来,人类语言的机器翻译研究取得了实质性进展,从在线双语文本中自动收集的表面模式对某些语言对的翻译效果非常好。然而,对于许多语言对,即使是最好的系统的输出也是乱码的、不合语法的、难以解释的。尽管这对语言很重要,但汉英翻译系统需要特别改进,而英汉翻译对个人之间的交流同样重要,但很少有人研究。该项目开发了在语义而非表面水平上自动学习中英文对应关系的方法,使机器翻译受益于最近在文本语义分析和自然语言生成方面的工作。这项工作的一部分决定了哪种类型的源语言句子的语义分析可以最好地为翻译系统提供信息,重点是分析省略的论点,共同引用链接和子句之间的话语关系。在汉译英的过程中,这些语言现象通常必须更加明确。第二部分的工作将自然语言生成集成到统计机器翻译中,利用生成技术来确定句子边界、成分排序和翻译系统容易出错的功能词的产生。第三部分开发并比较了用于训练和解码基于语义表示的机器翻译模型的算法。这些研究都是利用新开发的语言资源进行汉英语义分析。改进机器翻译技术的最终好处是更容易获取信息和更容易进行个人之间的交流。这反过来又带来了更多的贸易机会,以及文化之间更好的理解。本计划的中文对英文及英文对中文系统的发展,期望将来能应用于其他语言对。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Martha Palmer其他文献

A Case for Rule-Driven Semantic Processing
规则驱动的语义处理案例
A Large-Scale Extension of VerbNet with Novel Verb Classes
VerbNet 的大规模扩展与新颖的动词类
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Kipper;A. Korhonen;Neville Ryant;Martha Palmer
  • 通讯作者:
    Martha Palmer
SCI 3.0: A Web-based Schema Curation Interface for Graphical Event Representations
SCI 3.0:用于图形事件表示的基于 Web 的模式管理界面
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Reece Suchocki;Mary Martin;Martha Palmer;S. Brown
  • 通讯作者:
    S. Brown
VerbNet Representations: Subevent Semantics for Transfer Verbs
VerbNet 表示:转移动词的子事件语义
Good Seed Makes a Good Crop: Accelerating Active Learning Using Language Modeling
好种子结出好庄稼:使用语言建模加速主动学习

Martha Palmer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Martha Palmer', 18)}}的其他基金

RI:Medium:Collaborative Research: Developing a Uniform Meaning Representation for Natural Language Processing
RI:中:协作研究:为自然语言处理开发统一的含义表示
  • 批准号:
    1764048
  • 财政年份:
    2018
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
CI-P: Collaborative Research: LexLink: Aligning WordNet, FrameNet, PropBank and VerbNet
CI-P:协作研究:LexLink:对齐 WordNet、FrameNet、PropBank 和 VerbNet
  • 批准号:
    1205484
  • 财政年份:
    2012
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Small: A Bayesian Approach to Dynamic Lexical Resources for Flexible Language Processing
RI:小:用于灵活语言处理的动态词汇资源的贝叶斯方法
  • 批准号:
    1116782
  • 财政年份:
    2011
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
Collaborative Research: CRI: CRD: A Multi-Representational and Multi-Layered Treebank for Hindi/Urdu
合作研究:CRI:CRD:印地语/乌尔都语的多表征和多层树库
  • 批准号:
    0751202
  • 财政年份:
    2008
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
CRI:CRD Collaborative Research: General Techniques for Creating Treebanks with Multiple Representations: A Large-Scale Russian Application
CRI:CRD 协作研究:创建具有多种表示的树库的通用技术:俄罗斯的大规模应用
  • 批准号:
    0709167
  • 财政年份:
    2007
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
Advancing the Performance of Word Sense Disambiguation by Finding Consistent Criteria for Sense Distinctions
通过寻找语义区分的一致标准来提高词义消歧的性能
  • 批准号:
    0715078
  • 财政年份:
    2006
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
Advancing the Performance of Word Sense Disambiguation by Finding Consistent Criteria for Sense Distinctions
通过寻找语义区分的一致标准来提高词义消歧的性能
  • 批准号:
    0415923
  • 财政年份:
    2004
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
MLIAM: ISLE-International Standards for Language Engineering
MLIAM:ISLE-语言工程国际标准
  • 批准号:
    9910603
  • 财政年份:
    2000
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
Associating Semantic features with Intersective Levin classes
将语义特征与 Intersective Levin 类关联
  • 批准号:
    9800658
  • 财政年份:
    1998
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
Experimenting with Different Control Structures for Text Analysis
尝试不同的控制结构进行文本分析
  • 批准号:
    9412898
  • 财政年份:
    1995
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant

相似国自然基金

水稻穗粒数调控关键因子LARGE6的分子遗传网络解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
量子自旋液体中拓扑拟粒子的性质:量子蒙特卡罗和新的large-N理论
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    62 万元
  • 项目类别:
    面上项目
甘蓝型油菜Large Grain基因调控粒重的分子机制研究
  • 批准号:
    31972875
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
Large PB/PB小鼠 视网膜新生血管模型的研究
  • 批准号:
    30971650
  • 批准年份:
    2009
  • 资助金额:
    8.0 万元
  • 项目类别:
    面上项目
基因discs large在果蝇卵母细胞的后端定位及其体轴极性形成中的作用机制
  • 批准号:
    30800648
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
LARGE基因对口腔癌细胞中α-DG糖基化及表达的分子调控
  • 批准号:
    30772435
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Medium: A Rigorous, General Framework for Tractable Learning of Large-Scale DAGs from Data
协作研究:RI:Medium:从数据中轻松学习大规模 DAG 的严格通用框架
  • 批准号:
    1956330
  • 财政年份:
    2020
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Medium: A Rigorous, General Framework for Tractable Learning of Large-Scale DAGs from Data
协作研究:RI:Medium:从数据中轻松学习大规模 DAG 的严格通用框架
  • 批准号:
    1955532
  • 财政年份:
    2020
  • 资助金额:
    $ 56万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Incorporating Biologically-Motivated Circuit Motifs into Large-Scale Deep Neural Network Models of the Brain
RI:中:协作研究:将生物驱动的电路基序纳入大脑的大规模深度神经网络模型
  • 批准号:
    1704938
  • 财政年份:
    2017
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Incorporating Biological-Motivated Circuit Motifs into Large-Scale Deep Neural Network Models of the Brain
RI:中:协作研究:将生物驱动的电路基序纳入大脑的大规模深度神经网络模型
  • 批准号:
    1703161
  • 财政年份:
    2017
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Large: Collaborative Research: A Robotic Network for Locating and Removing Invasive Carp from Inland Lakes
RI:大型:合作研究:用于定位和清除内陆湖泊入侵鲤鱼的机器人网络
  • 批准号:
    1534122
  • 财政年份:
    2015
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: BCSP: Automated Parameter Tuning of Large-Scale Spiking Neural Networks
RI:媒介:协作研究:BCSP:大规模尖峰神经网络的自动参数调整
  • 批准号:
    1302256
  • 财政年份:
    2013
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: BCSP: Automated Parameter Tuning of Large-Scale Spiking Neural Networks
RI:媒介:协作研究:BCSP:大规模尖峰神经网络的自动参数调整
  • 批准号:
    1302125
  • 财政年份:
    2013
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: 'Houston We Have A Solution': Novel Speech Processing Advancements for Analysis of Large Asynchronous Multi-Channel Audio Corpora
RI:小型:协作研究:“休斯顿,我们有一个解决方案”:用于分析大型异步多通道音频语料库的新颖语音处理进步
  • 批准号:
    1219130
  • 财政年份:
    2012
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Large: Collaborative Research: Reconstructive recognition: Uniting statistical scene understanding and physics-based visual reasoning
RI:大型:协作研究:重建识别:结合统计场景理解和基于物理的视觉推理
  • 批准号:
    1212928
  • 财政年份:
    2012
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: 'Houston, We Have a Solution': Novel Speech Processing Advancements for Analysis of Large Asynchronous Multi-Channel Audio Corpora
RI:小型:协作研究:“休斯顿,我们有一个解决方案”:用于分析大型异步多通道音频语料库的新颖语音处理进步
  • 批准号:
    1218159
  • 财政年份:
    2012
  • 资助金额:
    $ 56万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了