Massively parallel computing in natural language technology

自然语言技术中的大规模并行计算

基本信息

  • 批准号:
    389655-2010
  • 负责人:
  • 金额:
    $ 10.26万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Research Tools and Instruments - Category 1 (<$150,000)
  • 财政年份:
    2009
  • 资助国家:
    加拿大
  • 起止时间:
    2009-01-01 至 2010-12-31
  • 项目状态:
    已结题

项目摘要

While the best known trend in speech and language processing over the last twenty years is probably still its adoption of statistical methods to crack open a variety of previously intractable computing applications (speech recognition, machine translation, web-page search, etc.), this field has recently turn another, very different, less celebrated, but equally transformative corner. State of the art research on many of these applications can now be spotted not so much by their radically new techniques, although innovations have of course still been forthcoming, as by their radically larger **scales**. A great many machine translation groups still essentially use IBM's models from the early 1990s, but trained over half a petabyte (a megabyte of megabytes) of data. The best text-to-speech synthesizers manipulate speech signals in about the same way as their predecessors did 15 years ago, in fact, but they paste together pieces of recorded speech from databases that are tens of thousands of times larger than they were back then. Bigger now does actually go a very long way towards producing better.
虽然在过去的二十年里,语音和语言处理领域最著名的趋势可能仍然是采用统计方法来破解各种以前难以处理的计算应用(语音识别,机器翻译,网页搜索等),这一领域最近出现了另一个非常不同的、不那么著名但同样具有变革性的转折点。 对许多这些应用的最新研究现在可以通过其全新的技术来发现,尽管创新当然仍然是即将到来的,因为它们的规模非常大。 许多机器翻译团队仍然基本上使用20世纪90年代早期的IBM模型,但训练了超过半PB(兆字节)的数据。 事实上,最好的文本到语音合成器处理语音信号的方式与15年前的前辈大致相同,但它们将来自数据库的记录语音片段粘贴在一起,这些数据库比当时大数万倍。 现在,更大的规模实际上对生产更好的产品大有帮助。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Penn, Gerald其他文献

Bubble Sets: Revealing Set Relations with Isocontours over Existing Visualizations

Penn, Gerald的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Penn, Gerald', 18)}}的其他基金

Privacy-Preserving Natural Language Processing
保护隐私的自然语言处理
  • 批准号:
    RGPIN-2022-05197
  • 财政年份:
    2022
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Spreading the Word: The Theory of Distributed Representations in Speech and Natural Language Processing
传播信息:语音和自然语言处理中的分布式表示理论
  • 批准号:
    RGPIN-2015-04069
  • 财政年份:
    2019
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Spreading the Word: The Theory of Distributed Representations in Speech and Natural Language Processing
传播信息:语音和自然语言处理中的分布式表示理论
  • 批准号:
    RGPIN-2015-04069
  • 财政年份:
    2018
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Spreading the Word: The Theory of Distributed Representations in Speech and Natural Language Processing
传播信息:语音和自然语言处理中的分布式表示理论
  • 批准号:
    RGPIN-2015-04069
  • 财政年份:
    2017
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Refactoring Feature-Structure-based Dialogue Systems: Software Engineering Meets Spoken Language Processing
重构基于特征结构的对话系统:软件工程与口语处理的结合
  • 批准号:
    518202-2017
  • 财政年份:
    2017
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Engage Grants Program
Spreading the Word: The Theory of Distributed Representations in Speech and Natural Language Processing
传播信息:语音和自然语言处理中的分布式表示理论
  • 批准号:
    RGPIN-2015-04069
  • 财政年份:
    2016
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Articulatory Speech Synthesis for Natural User Interfaces
自然用户界面的发音合成
  • 批准号:
    463376-2014
  • 财政年份:
    2015
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Strategic Projects - Group
Spreading the Word: The Theory of Distributed Representations in Speech and Natural Language Processing
传播信息:语音和自然语言处理中的分布式表示理论
  • 批准号:
    RGPIN-2015-04069
  • 财政年份:
    2015
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Spoken language processing in ecologically valid contexts
生态有效环境中的口语处理
  • 批准号:
    239533-2010
  • 财政年份:
    2014
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Discovery Grants Program - Individual
Articulatory Speech Synthesis for Natural User Interfaces
自然用户界面的发音合成
  • 批准号:
    463376-2014
  • 财政年份:
    2014
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Strategic Projects - Group

相似国自然基金

强流低能加速器束流损失机理的Parallel PIC/MCC算法与实现
  • 批准号:
    11805229
  • 批准年份:
    2018
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Principles and Practice of Massively-Parallel Computing Based on Tropical Algebra
基于热带代数的大规模并行计算原理与实践
  • 批准号:
    20K21794
  • 财政年份:
    2020
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
CDS&E: Optimal control of material microstructure evolution via massively parallel computing
CDS
  • 批准号:
    1802867
  • 财政年份:
    2018
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Standard Grant
Development of a new method for computing singular pairs suitable for massively parallel computing environments
开发适合大规模并行计算环境的奇异对计算新方法
  • 批准号:
    17K00167
  • 财政年份:
    2017
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Shared-memory massively parallel computing platform for high-productivity and high-performance
共享内存大规模并行计算平台,实现高生产率和高性能
  • 批准号:
    17H01711
  • 财政年份:
    2017
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CDS&E: Massively Parallel Quantum Dynamics: Computing many accurate quantum states for real molecular applications
CDS
  • 批准号:
    1665370
  • 财政年份:
    2017
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Standard Grant
Accelerating biomedical image processing using massively parallel processors
使用大规模并行处理器加速生物医学图像处理
  • 批准号:
    9138396
  • 财政年份:
    2016
  • 资助金额:
    $ 10.26万
  • 项目类别:
Massively parallel mapping of all molecular interactions in a single tube
单管中所有分子相互作用的大规模并行映射
  • 批准号:
    9145743
  • 财政年份:
    2015
  • 资助金额:
    $ 10.26万
  • 项目类别:
II-New: A Research Platform for Heterogeneous, Massively Parallel Computing
II-New:异构大规模并行计算研究平台
  • 批准号:
    1513126
  • 财政年份:
    2015
  • 资助金额:
    $ 10.26万
  • 项目类别:
    Standard Grant
Massively parallel identification of functional 3' UTR variants in asthma
哮喘功能性 3 UTR 变异的大规模并行鉴定
  • 批准号:
    8901295
  • 财政年份:
    2014
  • 资助金额:
    $ 10.26万
  • 项目类别:
Massively parallel identification of functional 3' UTR variants in asthma
哮喘功能性 3 UTR 变异的大规模并行鉴定
  • 批准号:
    9278264
  • 财政年份:
    2014
  • 资助金额:
    $ 10.26万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了