RI: Small: From acoustics to semantics: Embedding speech for a hierarchy of tasks

RI:小:从声学到语义:为任务层次结构嵌入语音

基本信息

  • 批准号:
    1816627
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-15 至 2021-07-31
  • 项目状态:
    已结题

项目摘要

There is an increasingly large array of spoken language interfaces available, such as virtual assistants and telephone customer service interfaces. These technologies both (1) recognize the words spoken by a user and (2) extract actionable information, such as the topic of the user's query and the degree of match between the query and documents in a database. Such applications are typically treated as a pipeline of automatic speech transcription followed by text processing to extract the meaning. This project aims to develop technology that directly extracts meaning from speech, while using a variety of linguistic information along the way. This approach is intended to mitigate the effects of speech recognition errors, as well as to use all of the meaning-bearing information in speech, such as intonation. This work is expected to have long-term broad impact through technological advances, as well as immediate broad impact through the PI's involvement in local schools and mentoring for a diverse set of visiting students.The technical goals of this work are (1) to do high-quality natural language processing directly on speech; (2) to seamlessly integrate domain knowledge into end-to-end speech models; (3) improve the performance-vs.-resources tradeoff; and (4) develop models for embedding arbitrary speech signals into meaning-bearing representations. The process of mapping from speech to meaning can be viewed as a hierarchy of tasks, from the most basic acoustic-phonetic tasks to the deepest semantic tasks. The experimental work will focus on two task hierarchies: a "retrieval" hierarchy including query-by-example search, keyword spotting, semantic speech search; and a "recognition" hierarchy including phonetic recognition, word recognition, parsing, and topic identification. The main technical approaches to be developed include hierarchical multitask learning methods for incorporating domain knowledge and mitigating low-data settings, as well as new models for acoustic-semantic speech embedding.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
有越来越多的可用的口语接口,例如虚拟助理和电话客户服务接口。这些技术既(1)识别用户说出的单词,(2)提取可操作的信息,例如用户查询的主题以及查询与数据库中的文档之间的匹配程度。这类应用程序通常被视为自动语音转录的管道,随后进行文本处理以提取含义。该项目旨在开发直接从语音中提取含义的技术,同时在此过程中使用各种语言信息。这种方法的目的是减轻语音识别错误的影响,以及使用语音中的所有承载意义的信息,例如语调。这项工作的技术目标是(1)直接对语音进行高质量的自然语言处理;(2)将领域知识无缝地集成到端到端的语音模型中;(3)改进性能与资源的权衡;(4)开发将任意语音信号嵌入到具有意义的表示中的模型。从语音到意义的映射过程可以看作是一个任务的层次结构,从最基本的声学-语音任务到最深层的语义任务。实验工作将集中在两个任务层次上:一个是包括逐例查询、关键字识别、语义语音搜索的“检索”层次,另一个是包括语音识别、单词识别、句法分析和主题识别的“识别”层次。将开发的主要技术方法包括用于整合领域知识和缓解低数据环境的分层多任务学习方法,以及用于声学-语义语音嵌入的新模型。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Semantic Query-by-example Speech Search Using Visual Grounding
A Correspondence Variational Autoencoder for Unsupervised Acoustic Word Embeddings
  • DOI:
  • 发表时间:
    2020-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Puyuan Peng;H. Kamper;Karen Livescu
  • 通讯作者:
    Puyuan Peng;H. Kamper;Karen Livescu
Multilingual Jointly Trained Acoustic and Written Word Embeddings
  • DOI:
    10.21437/interspeech.2020-2828
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yushi Hu;Shane Settle;Karen Livescu
  • 通讯作者:
    Yushi Hu;Shane Settle;Karen Livescu
On the contributions of visual and textual supervision in low-resource semantic speech retrieval
视觉和文本监督在低资源语义语音检索中的贡献
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pasad, A.;Shi, B.;Kamper, H.;Livescu, K.
  • 通讯作者:
    Livescu, K.
Whole-Word Segmental Speech Recognition with Acoustic Word Embeddings
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Karen Livescu其他文献

Discriminatively Structured Graphical Models for Speech Recognition The Graphical Models Team JHU 2001 Summer Workshop
用于语音识别的判别式结构化图形模型图形模型团队 JHU 2001 年夏季研讨会
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Bilmes;G. Zweig;Karen Livescu
  • 通讯作者:
    Karen Livescu
Eating Activity Monitoring in Home Environments Using Smartphone-Based Video Recordings
使用基于智能手机的视频记录来监测家庭环境中的饮食活动
A comparison of training approaches for discriminative segmental models
判别分段模型训练方法的比较
Feature-based pronunciation modeling for automatic speech recognition
用于自动语音识别的基于特征的发音建模
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Karen Livescu
  • 通讯作者:
    Karen Livescu
DiscreteSLU: A Large Language Model with Self-Supervised Discrete Speech Units for Spoken Language Understanding
DiscreteSLU:具有自监督离散语音单元的大型语言模型,用于口语理解
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suwon Shon;Kwangyoun Kim;Yi;Prashant Sridhar;Shinji Watanabe;Karen Livescu
  • 通讯作者:
    Karen Livescu

Karen Livescu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Karen Livescu', 18)}}的其他基金

EAGER: Discovery of Segmental Sub-Word Structure in Speech
EAGER:语音中分段子词结构的发现
  • 批准号:
    1433485
  • 财政年份:
    2014
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Models of Handshape Articulatory Phonology for Recognition and Analysis of American Sign Language
RI:媒介:协作研究:用于识别和分析美国手语的手形发音音系模型
  • 批准号:
    1409837
  • 财政年份:
    2014
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Small: Multi-View Learning of Acoustic Features for Speech Recognition Using Articulatory Measurements
RI:小:使用发音测量进行语音识别的声学特征的多视图学习
  • 批准号:
    1321015
  • 财政年份:
    2013
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Explicit Articulatory Models of Spoken Language, with Application to Automatic Speech Recognition
RI:媒介:协作研究:口语显式发音模型及其在自动语音识别中的应用
  • 批准号:
    0905633
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

A universal high-throughput platform to improve biological functions of small molecules
改善小分子生物学功能的通用高通量平台
  • 批准号:
    10668534
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
A universal high-throughput platform to improve biological functions of small molecules
改善小分子生物学功能的通用高通量平台
  • 批准号:
    10223388
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
A universal high-throughput platform to improve biological functions of small molecules
改善小分子生物学功能的通用高通量平台
  • 批准号:
    10620864
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
A universal high-throughput platform to improve biological functions of small molecules
改善小分子生物学功能的通用高通量平台
  • 批准号:
    10039410
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
Analysis and Synthesis of Small Room Acoustics
小房间声学分析与综合
  • 批准号:
    426805376
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Research Grants
Diagnosing Small Joints by Soft Ultrasound Probes
通过软超声探头诊断小关节
  • 批准号:
    9437235
  • 财政年份:
    2017
  • 资助金额:
    $ 45万
  • 项目类别:
Microfluidic Tissue Engineering of Small Airway Injuries
小气道损伤的微流控组织工程
  • 批准号:
    9260421
  • 财政年份:
    2017
  • 资助金额:
    $ 45万
  • 项目类别:
A noninvasive method for tissue stiffness quantification in small animals with shear wave elastography
一种利用剪切波弹性成像对小动物组织硬度进行无创定量的方法
  • 批准号:
    9516302
  • 财政年份:
    2017
  • 资助金额:
    $ 45万
  • 项目类别:
Small Animal Photoacoustic Imaging Unit: Integrating Optical Imaging with High Fr
小动物光声成像装置:光学成像与高频相结合
  • 批准号:
    8640794
  • 财政年份:
    2014
  • 资助金额:
    $ 45万
  • 项目类别:
WHOLE-BODY SMALL-ANIMAL PHOTOACOUSTIC-ULTRASONIC COMPUTED TOMOGRAPHY
小动物全身光声超声计算机断层扫描
  • 批准号:
    8507343
  • 财政年份:
    2013
  • 资助金额:
    $ 45万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了