RI: Small: Multi-View Learning of Acoustic Features for Speech Recognition Using Articulatory Measurements

RI:小:使用发音测量进行语音识别的声学特征的多视图学习

基本信息

  • 批准号:
    1321015
  • 负责人:
  • 金额:
    $ 44.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-01 至 2017-08-31
  • 项目状态:
    已结题

项目摘要

This project explores techniques for learning acoustic features for speech recognition, based on multi-view learning using acoustic and articulatory recordings. Recent work has shown recognition improvements using this strategy via linear and nonlinear canonical correlation analysis, in which transformations of acoustic features are learned so as to maximize correlation with (transformations of) articulatory measurements. Prior work has been limited to a single database and a single language.The main goals of this project are to learn better universal features for arbitrary speakers and languages and to develop improved multi-view techniques. Project activities include: learning time-varying projections; multi-view techniques based on neural networks; "many-view" learning using articulation, video, labels, etc.; efficient implementations; new input features such as spectro-temporal filters; and visualization tools for related research and education.A critical component of automatic speech recognition is a representation of the audio signal that encapsulates useful information while discarding acoustic noise, speaker identity, and so on. This project aims to automatically learn improved representations using statistical analysis of audio recordings paired with positions of the speech articulators (lips, tongue, etc.) and other measurements. The project starts with basic statistical techniques, and develops new techniques that address challenges and opportunities specific to speech and related signals.The project's impact extends beyond speech processing. Applications of multi-view representation learning include neurology, meteorology, chemometrics, computer vision, and text processing; all of these can benefit from the improved techniques. The work impacts education by generating materials for a Speech Technologies course and visualization tools for speech and other signals.
这个项目探讨了学习语音识别的声学特征的技术,基于使用声学和发音记录的多视图学习。 最近的工作表明,通过线性和非线性典型相关分析,使用这种策略的识别改进,其中声学特征的变换被学习,以便最大限度地提高与发音测量(变换)的相关性。 以前的工作一直局限于一个单一的数据库和一种语言。这个项目的主要目标是学习更好的通用功能,为任意扬声器和语言,并开发改进的多视图技术。 项目活动包括:学习时变投影;基于神经网络的多视图技术;使用清晰度、视频、标签等的“多视图”学习;高效的实施;新的输入特征,例如频谱时间滤波器;自动语音识别的一个关键组成部分是音频信号的表示,该音频信号封装了有用的信息,同时丢弃了声学噪声,说话人身份,该项目旨在通过对语音发音器官位置配对的音频记录进行统计分析来自动学习改进的表示(嘴唇、舌头等)和其他测量。 该项目从基本的统计技术开始,并开发新技术,以应对语音和相关信号的挑战和机遇。该项目的影响超出了语音处理。 多视图表示学习的应用包括神经学、气象学、化学计量学、计算机视觉和文本处理;所有这些都可以从改进的技术中受益。 这项工作通过为语音技术课程生成材料以及语音和其他信号的可视化工具来影响教育。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Karen Livescu其他文献

Discriminatively Structured Graphical Models for Speech Recognition The Graphical Models Team JHU 2001 Summer Workshop
用于语音识别的判别式结构化图形模型图形模型团队 JHU 2001 年夏季研讨会
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Bilmes;G. Zweig;Karen Livescu
  • 通讯作者:
    Karen Livescu
Eating Activity Monitoring in Home Environments Using Smartphone-Based Video Recordings
使用基于智能手机的视频记录来监测家庭环境中的饮食活动
Feature-based pronunciation modeling for automatic speech recognition
用于自动语音识别的基于特征的发音建模
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Karen Livescu
  • 通讯作者:
    Karen Livescu
A comparison of training approaches for discriminative segmental models
判别分段模型训练方法的比较
DiscreteSLU: A Large Language Model with Self-Supervised Discrete Speech Units for Spoken Language Understanding
DiscreteSLU:具有自监督离散语音单元的大型语言模型,用于口语理解
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suwon Shon;Kwangyoun Kim;Yi;Prashant Sridhar;Shinji Watanabe;Karen Livescu
  • 通讯作者:
    Karen Livescu

Karen Livescu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Karen Livescu', 18)}}的其他基金

RI: Small: From acoustics to semantics: Embedding speech for a hierarchy of tasks
RI:小:从声学到语义:为任务层次结构嵌入语音
  • 批准号:
    1816627
  • 财政年份:
    2018
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Continuing Grant
EAGER: Discovery of Segmental Sub-Word Structure in Speech
EAGER:语音中分段子词结构的发现
  • 批准号:
    1433485
  • 财政年份:
    2014
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Models of Handshape Articulatory Phonology for Recognition and Analysis of American Sign Language
RI:媒介:协作研究:用于识别和分析美国手语的手形发音音系模型
  • 批准号:
    1409837
  • 财政年份:
    2014
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Explicit Articulatory Models of Spoken Language, with Application to Automatic Speech Recognition
RI:媒介:协作研究:口语显式发音模型及其在自动语音识别中的应用
  • 批准号:
    0905633
  • 财政年份:
    2009
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

RI: Small: Understanding the Inductive Bias Caused by Invariance and Multi Scale in Neural Networks
RI:小:理解神经网络中不变性和多尺度引起的归纳偏差
  • 批准号:
    2213335
  • 财政年份:
    2022
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: III: SHF: Small: Multi-Stakeholder Decision Making: Qualitative Preference Languages, Interactive Reasoning, and Explanation
协作研究:RI:III:SHF:小型:多利益相关者决策:定性偏好语言、交互式推理和解释
  • 批准号:
    2225824
  • 财政年份:
    2022
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: III: SHF: Small: Multi-Stakeholder Decision Making: Qualitative Preference Languages, Interactive Reasoning, and Explanation
协作研究:RI:III:SHF:小型:多利益相关者决策:定性偏好语言、交互式推理和解释
  • 批准号:
    2225823
  • 财政年份:
    2022
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Small: Cooperative Planning and Learning via Scalable and Learnable Multi-Agent Commitments
RI:小型:通过可扩展和可学习的多代理承诺进行合作规划和学习
  • 批准号:
    2154904
  • 财政年份:
    2022
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Efficient Bi- and Multi-Objective Search Algorithms
NSF-BSF:RI:小型:高效的双目标和多目标搜索算法
  • 批准号:
    2121028
  • 财政年份:
    2021
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Resource-Constrained Multi-hypothesis-aware Perception
NSF-BSF:RI:小型:资源受限的多假设感知感知
  • 批准号:
    2008279
  • 财政年份:
    2020
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Small: Lightly Supervised Deep Learning for Multi-Frame Visual Motion Analysis
RI:小型:用于多帧视觉运动分析的轻监督深度学习
  • 批准号:
    1909821
  • 财政年份:
    2019
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Small: Variation and self-organization in multi-agent systems
RI:小:多智能体系统中的变化和自组织
  • 批准号:
    1816777
  • 财政年份:
    2018
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Small: Algorithmic Mechanism Design for Multi-Type Resource Allocation
RI:Small:多类型资源分配的算法机制设计
  • 批准号:
    1716333
  • 财政年份:
    2017
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
RI: Small: Multi-View Latent Class Discovery and Prediction with a Streamlined Analytics Platform
RI:小型:使用简化的分析平台进行多视图潜在类别发现和预测
  • 批准号:
    1718738
  • 财政年份:
    2017
  • 资助金额:
    $ 44.49万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了