CCRI: ENS: Next Generation Tools for Spoken Language Science & Technology

CCRI:ENS:下一代口语科学工具

基本信息

  • 批准号:
    2120435
  • 负责人:
  • 金额:
    $ 184万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

The task of automatic speech recognition (ASR) and spoken language understanding embodies almost all the elements of artificial intelligence (AI). Reliable ASR (when ubiquitously available) will be a key enabler of robust intelligence research in spoken dialog systems for human-computer interactions, information integration research in content-based multimedia search and access to oral history archives, and fundamental speech science and technology to enable research in children's cognitive development, linguistics, smart health, elderly care, education, and (broadly) the machine-aided study of behavioral and social dynamics. This project, developed after extensive consultations with the speech and language research community, is extensively revising the Kaldi open-source toolkit to (a) make speech recognition more accessible both for beginners in speech recognition and researchers in other fields, (b) leverage existing deep learning framework (primarily PyTorch) to increase its flexibility, (c) create new user training materials, and (d) continue to enhance the toolkit, so as to support the growth of and cooperation within the community.The project implements all core Kaldi functions (e.g., the lattice-free maximum mutual information training objective) natively in generic AI/deep learning frameworks, primarily PyTorch, so that associated advances in deep learning (e.g., novel optimization algorithms) can be seamlessly leveraged. Furthermore, the project incorporates automatic differentiation through finite state transducers, a core Kaldi feature responsible for its state-of-the-art performance, permitting true end-to-end training of ASR systems. These and other enhancements will make it possible to achieve two currently incompatible goals: incorporating structure external knowledge (e.g., dialog flow models, finite state grammars, pronunciation lexicons) into fully neural ASR systems, and end-to-end training of a hybrid ASR system via backpropagation. Other goals of this proposal include the provision of efficient yet user-friendly data preparation and model management tools for large scale training of ASR systems, and capabilities for robust conversation analysis and speaker diarization needed by researchers who use ASR as a tool for other scientific inquiries.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
自动语音识别(ASR)和口语理解的任务几乎包含了人工智能(AI)的所有元素。 可靠的ASR(当无处不在时)将成为人机交互口语对话系统中强大智能研究、基于内容的多媒体搜索和口述历史档案访问中的信息集成研究以及基础语音科学和技术的关键推动者,以实现儿童认知发展、语言学、智能健康、老年人护理、教育、以及(广义上)对行为和社会动力学的机器辅助研究。该项目是在与语音和语言研究社区进行广泛磋商后开发的,它正在广泛修订Kaldi开源工具包,以(a)使语音识别初学者和其他领域的研究人员更容易使用语音识别,(B)利用现有的深度学习框架(主要是PyTorch)以增加其灵活性,(c)创建新的用户培训材料,(d)继续增强工具包,以支持社区的发展和社区内的合作。该项目实现了Kaldi的所有核心功能(例如,无格最大互信息训练目标)原生地在通用AI/深度学习框架中,主要是PyTorch,使得深度学习的相关进步(例如,新颖的优化算法)可以无缝地被利用。此外,该项目通过有限状态传感器集成了自动微分,这是Kaldi的核心功能,负责其最先进的性能,允许ASR系统的真正端到端培训。这些和其他增强将有可能实现两个目前不兼容的目标:整合结构外部知识(例如,对话流模型、有限状态语法、发音词典)到全神经ASR系统中,以及通过反向传播对混合ASR系统进行端到端训练。该提案的其他目标包括为ASR系统的大规模培训提供高效且用户友好的数据准备和模型管理工具,和强大的会话分析和发言者日记的能力,研究人员谁使用ASR作为其他科学调查的工具所需要的。这个奖项反映了NSF的法定使命,并已被认为是值得通过评估使用基金会的智力价值和更广泛的影响审查标准。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Building Keyword Search System from End-To-End Asr Systems
Defense against Adversarial Attacks on Hybrid Speech Recognition System using Adversarial Fine-tuning with Denoiser
使用降噪器进行对抗性微调来防御混合语音识别系统的对抗性攻击
  • DOI:
    10.21437/interspeech.2022-10977
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Joshi, Sonal;Kataria, Saurabh;Shao, Yiwen;Żelasko, Piotr;Villalba, Jesús;Khudanpur, Sanjeev;Dehak, Najim
  • 通讯作者:
    Dehak, Najim
Chunking Defense for Adversarial Attacks on ASR
  • DOI:
    10.21437/interspeech.2022-11096
  • 发表时间:
    2022-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yiwen Shao;J. Villalba;Sonal Joshi;Saurabh Kataria;S. Khudanpur;N. Dehak
  • 通讯作者:
    Yiwen Shao;J. Villalba;Sonal Joshi;Saurabh Kataria;S. Khudanpur;N. Dehak
SURT 2.0: Advances in Transducer-Based Multi-Talker Speech Recognition
GPU-accelerated Guided Source Separation for Meeting Transcription
用于会议转录的 GPU 加速引导源分离
  • DOI:
    10.21437/interspeech.2023-42
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Raj, Desh;Povey, Daniel;Khudanpur, Sanjeev
  • 通讯作者:
    Khudanpur, Sanjeev
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sanjeev Khudanpur其他文献

Getting more from automatic transcripts for semi-supervised language modeling
  • DOI:
    10.1016/j.csl.2015.08.007
  • 发表时间:
    2016-03-01
  • 期刊:
  • 影响因子:
  • 作者:
    Scott Novotney;Richard Schwartz;Sanjeev Khudanpur
  • 通讯作者:
    Sanjeev Khudanpur
A dilemma of ground truth in noisy speech separation and an approach to lessen the impact of imperfect training data
  • DOI:
    10.1016/j.csl.2022.101410
  • 发表时间:
    2023-01-01
  • 期刊:
  • 影响因子:
  • 作者:
    Matthew Maciejewski;Jing Shi;Shinji Watanabe;Sanjeev Khudanpur
  • 通讯作者:
    Sanjeev Khudanpur
Towards machines that know when they do not know: Summary of work done at 2014 Frederick Jelinek Memorial workshop
走向知道何时不知道的机器:2014 年 Frederick Jelinek 纪念研讨会所做工作总结
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hynek Hermansky;Lukas Burget;Jordan Cohen;Emmanuel Dupoux Naomi Feldman;John Godfrey;Sanjeev Khudanpur;Matthew Maciejewski;Sri Harish Mallidi;Anjali Menon;Tetsuji Ogawa;Vijayaditya Peddinti;Richard Rose;Richard Stern;Matthew Wiesner;Karel Ve
  • 通讯作者:
    Karel Ve

Sanjeev Khudanpur的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sanjeev Khudanpur', 18)}}的其他基金

RI: Medium: Collaborative Research: Semi-Supervised Discriminative Training of Language Models
RI:媒介:协作研究:语言模型的半监督判别训练
  • 批准号:
    0963898
  • 财政年份:
    2010
  • 资助金额:
    $ 184万
  • 项目类别:
    Continuing Grant
Cross-Cutting Research Workshops on Intelligent Information Systems
智能信息系统跨领域研究研讨会
  • 批准号:
    1005411
  • 财政年份:
    2010
  • 资助金额:
    $ 184万
  • 项目类别:
    Continuing Grant
SGER: Self-Supervised Discriminative Training of Statistical Language Models
SGER:统计语言模型的自监督判别训练
  • 批准号:
    0840112
  • 财政年份:
    2008
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
PIRE: Investigation of Meaning Representations in Language Understanding for Machine Translation Systems
PIRE:机器翻译系统语言理解中的意义表示研究
  • 批准号:
    0530118
  • 财政年份:
    2005
  • 资助金额:
    $ 184万
  • 项目类别:
    Continuing Grant
SGER: Pronunciation Modeling for Conversational Speech Recognition
SGER:会话语音识别的发音建模
  • 批准号:
    9714169
  • 财政年份:
    1997
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant

相似国自然基金

基于色氨酸代谢调控ENS途径探讨电针治疗功能性消化不良的作用机制
  • 批准号:
    JCZRLH202500075
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于GDNF/PI3K/AKT信号通路探讨白术七物颗粒调控ENS-ICC-SMC网络治 疗气阴两虚型STC的机制研究
  • 批准号:
    2025JJ90111
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
水稻EnS150基因调控种子休眠和萌发的分子机制研究
  • 批准号:
    32301853
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
岩藻糖基化修饰的MSCs介导GDNF正反馈调控肠神经元焦亡及ENPC自噬促进ENS重建
  • 批准号:
    n/a
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
生孢梭菌通过“IPA-AHR-mTOR”轴调控ENPC自噬参与糖尿病ENS重建的机制研究
  • 批准号:
    82300616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于肠道菌群/5-HT/ENS调控的番茄红素改善肠动力作用机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MSCs胞外囊泡调控ENPC的SETD2/H3K36轴在糖尿病ENS重建中的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于lncRNA Ens6探讨天南星活性成分抑制线粒体分裂促进M2小胶质细胞极化改善缺血性脑卒中的作用机制研究
  • 批准号:
    82003976
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
岩藻糖基化在MSCs介导的ENS重建中的作用及机制研究
  • 批准号:
    81974068
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
从肌层巨噬细胞MM和ENS的Cross-talk 探讨广藿香活性成分对IBS-D肠神经稳态的调节机制
  • 批准号:
    81973586
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235160
  • 财政年份:
    2023
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235157
  • 财政年份:
    2023
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235158
  • 财政年份:
    2023
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235159
  • 财政年份:
    2023
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
Rôles adaptatifs des symbioses mutualistes hôte-microbiote chez les Téléostéens de l'Amazone
亚马逊河中微生物共生共生的适应性
  • 批准号:
    RGPIN-2019-04802
  • 财政年份:
    2022
  • 资助金额:
    $ 184万
  • 项目类别:
    Discovery Grants Program - Individual
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
  • 批准号:
    2120448
  • 财政年份:
    2021
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
CCRI: ENS: Evolving the Defects4J Benchmark and Infrastructure to Enable Sustained Innovation and Reproducibility in Software Engineering Research
CCRI:ENS:发展 Defects4J 基准和基础设施以实现软件工程研究的持续创新和可重复性
  • 批准号:
    2120070
  • 财政年份:
    2021
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
CCRI: ENS: Activity-Centric Interactive Environments for Embodied AI
CCRI:ENS:以活动为中心的嵌入式人工智能交互环境
  • 批准号:
    2120095
  • 财政年份:
    2021
  • 资助金额:
    $ 184万
  • 项目类别:
    Standard Grant
Altered ENS Neuroimmune Interactions Disrupt Gastrointestinal Motility in Alzheimers Disease
ENS 神经免疫相互作用的改变会破坏阿尔茨海默病的胃肠动力
  • 批准号:
    10653255
  • 财政年份:
    2021
  • 资助金额:
    $ 184万
  • 项目类别:
Altered ENS Neuroimmune Interactions Disrupt Gastrointestinal Motility in Alzheimers Disease
ENS 神经免疫相互作用的改变会破坏阿尔茨海默病的胃肠动力
  • 批准号:
    10689560
  • 财政年份:
    2021
  • 资助金额:
    $ 184万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了