ITR-(NHS)-(dmc)-TREEWORLD: Probabilistic Tree Transducers for Machine Translation and Natural Language Processing
ITR-(NHS)-(dmc)-TREEWORLD:用于机器翻译和自然语言处理的概率树转换器
基本信息
- 批准号:0428020
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2004
- 资助国家:美国
- 起止时间:2004-09-15 至 2009-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many recent advances in natural language processing (e.g., speech recognition and information extraction) are due to widespread use of finite-state automata. These automata probabilistically transform input strings into output strings, and they can be quickly assembled to tackle new jobs via generic mathematical operations like composition and forward application. However, these automata are a bad fit for many important problems that require syntax-sensitive transformations and large-scale re-ordering (such as language translation and summarization).We are investigating tree automata as an alternative building block for new natural language systems. These automata walk over input trees and produce output trees. Fortunately, there is an extensive mathematical theory associated with these devices. These automata also fit many of the ad hoc models recently proposed in natural language research. However, there are several critical missing pieces: (1) how to design efficient computer science algorithms for generic tree operations, (2) how to design efficient machine learning algorithms for inducing tree automata and probabilities from linguistic data, and (3) how to use automata to accurately model problems in automatic language translation.We expect this research to yield several benefits. Many researchers who currently use finite-state tools will switch to more powerful tree-based automata and obtain more accurate language processing systems. Also, tree automata will enable better understanding of how to model language translation more deeply and accurately, and -- importantly -- in such a way that syntactic and lexical translation knowledge can still be acquired fully automatically by the machine from text corpora.
自然语言处理的许多最新进展(例如,语音识别和信息提取)是由于有限状态自动机的广泛使用。 这些自动机将输入字符串概率地转换为输出字符串,并且它们可以通过合成和向前应用等通用数学运算快速组装以处理新的工作。 然而,这些自动机是一个坏的适合许多重要的问题,需要语法敏感的转换和大规模的重新排序(如语言翻译和摘要)。 这些自动机遍历输入树并产生输出树。 幸运的是,有一个广泛的数学理论与这些设备。 这些自动机也适合许多最近在自然语言研究中提出的特设模型。 然而,有几个关键的缺失部分:(1)如何设计有效的计算机科学算法的通用树操作,(2)如何设计有效的机器学习算法,从语言数据中诱导树自动机和概率,(3)如何使用自动机准确地建模自动语言翻译中的问题。 许多目前使用有限状态工具的研究人员将转向更强大的基于树的自动机,并获得更精确的语言处理系统。 此外,树自动机将使人们能够更好地理解如何更深入、更准确地对语言翻译进行建模,而且重要的是,机器仍然可以从文本语料库中完全自动地获取语法和词汇翻译知识。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kevin Knight其他文献
Two Approaches to Building Collaborative, Task-Oriented Dialog Agents through Self-Play
通过自我游戏构建协作的、面向任务的对话代理的两种方法
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Arkady Arkhangorodsky;Scot Fang;Victoria F. Knight;Ajay Nagesh;Maria Ryskina;Kevin Knight - 通讯作者:
Kevin Knight
Learning Phoneme Mappings for Transliteration without Parallel Data
在没有并行数据的情况下学习音素映射以进行音译
- DOI:
10.3115/1620754.1620761 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Sujith Ravi;Kevin Knight - 通讯作者:
Kevin Knight
Why Neural Translations are the Right Length
为什么神经翻译的长度合适
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Xing Shi;Kevin Knight;Deniz Yuret - 通讯作者:
Deniz Yuret
Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics
- DOI:
10.3115/981823 - 发表时间:
2005-06 - 期刊:
- 影响因子:0
- 作者:
Kevin Knight - 通讯作者:
Kevin Knight
Kevin Knight的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kevin Knight', 18)}}的其他基金
RI: Medium: Deciphering Natural Language (DECIPHER)
RI:媒介:破译自然语言 (DECIPHER)
- 批准号:
0904684 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Standard Grant
RI: Large:Collaborative Research: Richer Representations for Machine Translation (REPS)
RI:大型:协作研究:更丰富的机器翻译表示 (REPS)
- 批准号:
0908532 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Standard Grant
US-Egypt Cooperative Research: Integrating Statistical Machine Translation from Arabic to English with Syntactic and Semantic Analysis
美国-埃及合作研究:将阿拉伯语到英语的统计机器翻译与句法和语义分析相结合
- 批准号:
0210165 - 财政年份:2002
- 资助金额:
-- - 项目类别:
Standard Grant
STATGEN: Robust, Scalable Language Generation Using Symbolic and Statistical Techniques
STATGEN:使用符号和统计技术生成稳健、可扩展的语言
- 批准号:
9820291 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Continuing Grant
相似国自然基金
基于硬件高效型 IM-DD NHS-OFDM-PON 接收发机设计
- 批准号:2024JJ7272
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
NHS基因调控Wnt/PCP信号通路影响晶状体细胞骨架在先天性白内障中的作用机制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
EDC-NHS诱导玻璃体胶原和透明质酸交联调控玻璃体生物力学与眼球生长发育
- 批准号:82160208
- 批准年份:2021
- 资助金额:33 万元
- 项目类别:地区科学基金项目
光纤NHS-OFDM系统中关键DSP算法及其高效硬件实现
- 批准号:2020JJ4433
- 批准年份:2020
- 资助金额:0.0 万元
- 项目类别:省市级项目
脂肪酸-硫代NHS酯疏水改性鱼胶原及其静电纺纳米纤维结构与性能调控机理研究
- 批准号:21606156
- 批准年份:2016
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于天然胶原自组装及多元羧酸NHS酯调控的胶原水凝胶制备及其结构与性能
- 批准号:21476147
- 批准年份:2014
- 资助金额:95.0 万元
- 项目类别:面上项目
多功能聚羧酸-NHS酯改性溶液态胶原及其构效机理
- 批准号:21306024
- 批准年份:2013
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
多元羧酸NHS酯交联溶液型天然胶原的结构与性能研究
- 批准号:20876098
- 批准年份:2008
- 资助金额:35.0 万元
- 项目类别:面上项目
相似海外基金
ITR-(ASE+NHS)-(sim+dmc): Non-Equilibrium Surface Growth and the Scalability of Parallel Discrete-Event Simulations for Large Asynchronous Systems
ITR-(ASE NHS)-(sim dmc):大型异步系统的非平衡表面生长和并行离散事件仿真的可扩展性
- 批准号:
0426488 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR: Collaborative Research: -\(NHS+ASE)-\(int+dmc\): Networks of Robots and Sensors for First Responders
ITR:合作研究:-(NHS ASE)-(int dmc):急救人员的机器人和传感器网络
- 批准号:
0426838 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Continuing Grant
ITR-NHS-DMC: Making Speech Recognition Pervasive by Migrating it Into Silicon
ITR-NHS-DMC:通过将语音识别迁移到芯片中来使其普及
- 批准号:
0426904 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Continuing Grant
SCI: ITR-(NHS+ASE)-(int+dmc): Dependable Grids
SCI:ITR-(NHS ASE)-(int dmc):可靠的电网
- 批准号:
0426972 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR: COLLABORATIVE RESEARCH: (EVS+NHS) - (int+dmc): 'FAST Copper': Dynamic Optimization of Resources in Frequency, Amplitude, Space, and Time for Broadband Access Networks
ITR:协作研究:(EVS NHS) - (int dmc):“FAST Copper”:宽带接入网络频率、幅度、空间和时间资源的动态优化
- 批准号:
0427687 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR: Collaborative Research: (ACS+NHS)-(dmc+soc): Machine Learning for Sequences and Structured Data: Tools for Non-Experts
ITR:协作研究:(ACS NHS)-(dmc soc):序列和结构化数据的机器学习:非专家工具
- 批准号:
0428193 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR: Collaborative Research: (NHS+ASE)-(dmc+int+soc): A Wireless Local Positioning System for Mobile Remote Monitoring
ITR:协作研究:(NHS ASE)-(dmc int soc):用于移动远程监控的无线本地定位系统
- 批准号:
0426925 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR: COLLABORATIVE RESEARCH: -(ASE+NHS)-(dmc+int): Diagnosis and Assessment of Faults, Misbehavior and Threats in Distributed Systems and Networks
ITR:协作研究:-(ASE NHS)-(dmc int):分布式系统和网络中的故障、不当行为和威胁的诊断和评估
- 批准号:
0426831 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
ITR-(ASE+NHS)-(dmc+sim): Simulation Transformation for Dynamic, Data-Driven Application Systems (DDDAS)
ITR-(ASE NHS)-(dmc sim):动态数据驱动应用系统 (DDDAS) 的仿真转换
- 批准号:
0426971 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
SCI: ITR - (NHS + EVS) - (dmc + SIM) : Improving the Integrity of Domain Name System (DNS) Monitoring and Protection
SCI:ITR - (NHS EVS) - (dmc SIM):提高域名系统 (DNS) 监控和保护的完整性
- 批准号:
0427144 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Continuing Grant