Collaborative Research: Structure Alignment-based Machine Translation

合作研究:基于结构对齐的机器翻译

基本信息

  • 批准号:
    0534700
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2006
  • 资助国家:
    美国
  • 起止时间:
    2006-07-01 至 2010-06-30
  • 项目状态:
    已结题

项目摘要

Researchers at New York University, Monmouth University and theUniversity of Colorado are constructing Japanese/English andChinese/English machine translation systems which automatically acquirerules from ``deep'' linguistic analyses of parallel text. This workis a natural culmination of automated example-based MachineTranslation (MT) projects that have become increasingly sophisticatedover the last two decades. The following recent advances in NaturalLanguage Processing (NLP) technologies make this inquiry feasible: (1)annotated data including bilingual treebanks and processors trained onthis data (parsers, PropBankers, etc.); (2) semantic post-processorsof parser output; (3) programs that automatically align bitexts; and(4) bilingual tree to tree translation models.Natural languages vary widely in the ordering of corresponding wordsfor equivalent expressions across linguistic boundaries and within asingle language. This research investigates ways to minimize thevariations within a single language using a type of semanticrepresentation (GLARF) that is derived automatically from syntactictrees. Such semantic representation provides for: (1) a reduction in thenumber of ways of representing the same underlying message, and (2)a way to handle long distance dependencies (e.g. relativeclauses) as local phenomena. Therefore, there is no need to resort toarbitrarily long sentence fragments or large trees fortraining. Furthermore, since less data is needed, itminimizes the sparse data problem.In the training of this translation model, because of (1), the numberof mapping rules between the source tree and the target tree isreduced. The translation model, then, is a tree transducer, with``deep'' linguistically analyzed trees for both source and targetrepresentations. In order to provide efficient computer algorithmsfor such partial mappings, this research needs to focus on(a) the training algorithm and the (b) the constraints over themapping rules in order to reduce the computational complexity.This research is expected to yield several advantages: The corearchitecture of this transducer using ``deep'' linguistic analysesshould yield more accurate results. The GLARF architecture allowscontrol over different granularity of automatically-obtainedlinguistic analyses.Broader Impact: The demand for machine translation spans from thelocal government (e.g. police forces) to national government(e.g. CIA) and the private sector. Given the growth of the Internetoutside the English speaking world, better machine translation is ofcritical importance for the broader community. This work directlyaffects the ability of English speakers to understand websites writtenin Chinese and Japanese, two of the most widely used languages on theInternet. The technique is generalizable to other language pairs andcan ultimately have even wider impact.
纽约大学、蒙茅斯大学和科罗拉多大学的研究人员正在构建日/英和中/英机器翻译系统,这些系统可以从平行文本的“深层”语言分析中自动获取规则。 这项工作是自动化的基于示例的机器翻译(MT)项目的自然高潮,在过去的二十年里,这些项目已经变得越来越成熟。自然语言处理(NaturalLanguage Processing,NLP)技术的下列最新进展使这种研究成为可能:(1)注释数据,包括双语树库和在此数据上训练的处理器(解析器,PropBankers等); (2)语义分析器输出的后处理器;(3)自动对齐双文本的程序;(4)双语树到树翻译模型。自然语言在跨语言边界和单一语言内的等效表达的相应单词的顺序方面有很大差异。本研究探讨如何尽量减少在一个单一的语言使用一种类型的语义表示(GLARF),自动从语法树派生的变化。这样的语义表示提供:(1)减少表示相同底层消息的方式的数量,以及(2)将长距离依赖性(例如,相对子句)作为局部现象处理的方式。因此,没有必要求助于任意长的句子片段或大树进行训练。此外,由于所需的数据较少,它最大限度地减少了稀疏数据问题。在该翻译模型的训练中,由于(1),减少了源树和目标树之间的映射规则的数量。 因此,翻译模型是一个树转换器,具有针对源和目标表示的“深度”语言分析树。 为了给这种部分映射提供有效的计算机算法,本研究需要关注(a)训练算法和(B)映射规则的约束以降低计算复杂度。GLARF架构允许控制自动获得的语言分析的不同粒度。更广泛的影响:对机器翻译的需求从地方政府(例如警察部队)到国家政府(例如CIA)和私营部门。 考虑到英语世界以外的互联网的发展,更好的机器翻译对更广泛的社区至关重要。 这项工作直接影响到英语使用者理解中文和日文网站的能力,中文和日文是互联网上使用最广泛的两种语言。这项技术可以推广到其他语言对,并最终产生更广泛的影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Adam Meyers其他文献

Designing a dictionary of derived nominals
设计派生名词词典
  • DOI:
    10.1075/cilt.189.07mac
  • 发表时间:
    2000
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Macleod;Adam Meyers;R. Grishman;Leslie Barrett;Ruth Reeves
  • 通讯作者:
    Ruth Reeves
An observational study of the effectiveness and safety of intramuscular olanzapine in the treatment of acute agitation in patients with bipolar mania or schizophrenia/schizoaffective disorder
肌肉注射奥氮平治疗双相躁狂或精神分裂症/分裂情感障碍患者急性激越有效性和安全性的观察性研究
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    F. Centorrino;Adam Meyers;J. Ahl;Stephanie L. Cincotta;L. Zun;Angela H. Gulliver;B. Kinon;J. Houston
  • 通讯作者:
    J. Houston
Shared Corpora Working Group Report
共享语料库工作组报告
  • DOI:
    10.3115/1642059.1642088
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Adam Meyers;Nancy Ide;Ludovic Denoyer;Yusuke Shinyama
  • 通讯作者:
    Yusuke Shinyama
A282 Oral Opioids Are Not Needed After Bariatric Surgery
  • DOI:
    10.1016/j.soard.2019.08.227
  • 发表时间:
    2019-10-01
  • 期刊:
  • 影响因子:
  • 作者:
    Adam Meyers;Panduraga Yenumula;Gary Grinberg
  • 通讯作者:
    Gary Grinberg
Proceedings of the Workshop on Frontiers in Linguistically Annotated Corpora 2006
2006 年语言注释语料库前沿研讨会论文集
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Timothy Baldwin;Francis Bond;Adam Meyers;Shigeko Nariyama
  • 通讯作者:
    Shigeko Nariyama

Adam Meyers的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Adam Meyers', 18)}}的其他基金

Workshop Proposal: Content of Linguistic Annotation: Standards and Practices (CLASP)
研讨会提案:语言注释的内容:标准和实践(CLASP)
  • 批准号:
    0948101
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Computer Science and Computational Approaches to Music for Middle School and High School Students
面向中学生和高中生的计算机科学和音乐计算方法
  • 批准号:
    0834034
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: The influence of incoming plate structure and fluids on arc melt generation at the Lesser Antilles subduction system
合作研究:来料板结构和流体对小安的列斯群岛俯冲系统电弧熔化产生的影响
  • 批准号:
    2316136
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: The influence of incoming plate structure and fluids on arc melt generation at the Lesser Antilles subduction system
合作研究:来料板结构和流体对小安的列斯群岛俯冲系统电弧熔化产生的影响
  • 批准号:
    2316137
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Manipulating the Thermal Properties of Two-Dimensional Materials Through Interface Structure and Chemistry
合作研究:通过界面结构和化学控制二维材料的热性能
  • 批准号:
    2400352
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Manipulating the Thermal Properties of Two-Dimensional Materials Through Interface Structure and Chemistry
合作研究:通过界面结构和化学控制二维材料的热性能
  • 批准号:
    2400353
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Accurate and Structure-Preserving Numerical Schemes for Variable Temperature Phase Field Models and Efficient Solvers
合作研究:用于变温相场模型和高效求解器的精确且结构保持的数值方案
  • 批准号:
    2309547
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Assembling the foundation of modern mammal community structure in the first 7 million years after the K/Pg mass extinction
合作研究:为 K/Pg 大规模灭绝后的前 700 万年建立现代哺乳动物群落结构的基础
  • 批准号:
    2321344
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Molecular and Nanoscale Structure and Interactions of PFAS at Interfaces and Mixed Surfactant Systems
合作研究:PFAS 的分子和纳米结构以及界面和混合表面活性剂体系的相互作用
  • 批准号:
    2227128
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Reducing Model Uncertainty by Improving Understanding of Pacific Meridional Climate Structure during Past Warm Intervals
合作研究:通过提高对过去温暖时期太平洋经向气候结构的理解来降低模型不确定性
  • 批准号:
    2303568
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Structure and function: How microenvironment facilitates antimicrobial response to environmental stress in a defensive symbiosis
合作研究:结构和功能:微环境如何促进防御性共生中的抗菌剂对环境应激的反应
  • 批准号:
    2247195
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: RUI: The challenges of living small: functional tradeoffs in the vertebral bone structure of diminutive mammals
合作研究:RUI:小型生活的挑战:小型哺乳动物椎骨结构的功能权衡
  • 批准号:
    2223964
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了