RI:Small: Nonlinear signal representations for speech applications

RI:Small:语音应用的非线性信号表示

基本信息

  • 批准号:
    1816165
  • 负责人:
  • 金额:
    $ 33.68万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-15 至 2022-07-31
  • 项目状态:
    已结题

项目摘要

Human speech is a very rich signal. In addition to words, it contains several kinds of important information about the speaker such as identity, gender, age, native language, dialect, and emotion. It also provides information about the transmission channel and environment; for example, whether the speech came from a phone call or a high-fidelity recording, and whether or not there was background noise. This project aims to create a powerful uniform representation that reflects all the information carried by speech. Such representation would enable important speech applications in multiple sectors of society: commercial (security, healthcare, user interfaces), government (security, information filtering), and law enforcement (speaker identification, forensics).In this project, Johns Hopkins University researchers, who invented the original i-vector framework, intend to progress beyond the linear i-vector approach by investigating non-linear models with the expectation to better explain the complex structure of speech. To achieve this goal, two different models are investigated. First, a non-linear i-vector version is explored. In this method, the speech signal distribution is modeled by a Gaussian mixture model (GMM). The super-vector formed by the GMM means is a non-linear function (neural network) of a latent variable (speech representation). The parameters of the neural network and the latent representation can be jointly estimated by stochastic gradient descent iterations. Secondly, the team intends to investigate different types of auto-encoder networks (AE, VAE, RBM, DBM) to obtain representations from their hidden layers. Preliminary research shows that it is feasible to obtain good representations by combining activations from several hidden layers. Visualization tools are used to understand how the speech data have been represented and structured. By understanding the non-linear relationships created via the auto-encoder network modeling and using the visualization tools, there is potential to produce valuable insights into speech modeling. These insights can help cognitive science and neuroscience researchers to understand how the brain represents speech signals. The proposed methods are developed as software that takes a speech segment as input and generates a single vector that may be used to characterize the segment for the important applications mentioned in the previous paragraph.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人类语音是一种非常丰富的信号。除了文字之外,它还包含说话者的身份、性别、年龄、母语、方言、情感等多种重要信息。它还提供有关传输通道和环境的信息;例如,语音是否来自电话或高保真录音,以及是否有背景噪音。 该项目旨在创建一个强大的统一表示,反映语音携带的所有信息。这种表示将使社会多个领域的重要语音应用成为可能:商业(安全、医疗保健、用户界面)、政府(安全、信息过滤)和执法(说话人识别、取证)。 在这个项目中,发明了原始 i-向量框架的约翰·霍普金斯大学研究人员打算通过研究非线性模型来超越线性 i-向量方法,以期更好地解释语音的复杂结构。为了实现这一目标,研究了两种不同的模型。首先,探索非线性 i 向量版本。在该方法中,语音信号分布通过高斯混合模型(GMM)进行建模。由 GMM 均值形成的超向量是潜在变量(语音表示)的非线性函数(神经网络)。神经网络的参数和潜在表示可以通过随机梯度下降迭代来联合估计。其次,该团队打算研究不同类型的自动编码器网络(AE、VAE、RBM、DBM),以从其隐藏层获取表示。初步研究表明,通过组合多个隐藏层的激活来获得良好的表示是可行的。可视化工具用于理解语音数据是如何表示和结构化的。通过理解通过自动编码器网络建模创建的非线性关系并使用可视化工具,有可能对语音建模产生有价值的见解。这些见解可以帮助认知科学和神经科学研究人员了解大脑如何表示语音信号。所提出的方法被开发为软件,该软件将语音片段作为输入并生成单个向量,该向量可用于表征前一段中提到的重要应用的片段。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Najim Dehak其他文献

Deep Stroop: Integrating eye tracking and speech processing to characterize people with neurodegenerative disorders while performing neuropsychological tests
  • DOI:
    10.1016/j.compbiomed.2024.109398
  • 发表时间:
    2025-01-01
  • 期刊:
  • 影响因子:
  • 作者:
    Trevor Meyer;Anna Favaro;Esther S. Oh;Ankur Butala;Chelsie Motley;Pedro Irazoqui;Najim Dehak;Laureano Moro-Velázquez
  • 通讯作者:
    Laureano Moro-Velázquez
Unveiling early signs of Parkinson’s disease via a longitudinal analysis of celebrity speech recordings
通过对名人语音记录的纵向分析揭示帕金森病的早期迹象
  • DOI:
    10.1038/s41531-024-00817-9
  • 发表时间:
    2024-10-27
  • 期刊:
  • 影响因子:
    8.200
  • 作者:
    Anna Favaro;Ankur Butala;Thomas Thebaud;Jesús Villalba;Najim Dehak;Laureano Moro-Velázquez
  • 通讯作者:
    Laureano Moro-Velázquez

Najim Dehak的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Najim Dehak', 18)}}的其他基金

RI: Small: Collaborative Research: Automatic Creation of New Speech Sound Inventories
RI:小型:协作研究:自动创建新语音库存
  • 批准号:
    1909075
  • 财政年份:
    2019
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CIF: Small: RUI: Highly Nonlinear and Pseudorandom Structures for Communications and Sensing
CIF:小:RUI:用于通信和传感的高度非线性和伪随机结构
  • 批准号:
    2206454
  • 财政年份:
    2022
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
CHS: Small: Towards Next-Generation Large-Scale Nonlinear Deformable Simulation
CHS:小型:迈向下一代大规模非线性变形模拟
  • 批准号:
    2244651
  • 财政年份:
    2022
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
CCF: Small: Real-Number Function Encoding Driven Error Resilient Signal Processing and Control: Application to Nonlinear Systems from Adaptive Filters to DNNs
CCF:小型:实数函数编码驱动的误差弹性信号处理和控制:从自适应滤波器到 DNN 的非线性系统应用
  • 批准号:
    2128419
  • 财政年份:
    2021
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
Quantum optics with nonlinear organic small molecule enhanced integrated photonics devices
具有非线性有机小分子的量子光学增强集成光子器件
  • 批准号:
    2126404
  • 财政年份:
    2021
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
III: Small: Nonlinear Processes for Detailed and Principled Insight into Graph Data
III:小:非线性过程,用于详细、有原则地洞察图数据
  • 批准号:
    2007481
  • 财政年份:
    2020
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
Research and development of nonlinear Selective Inference for high-dimensional and small number of samples data
高维小样本数据非线性选择性推理研究进展
  • 批准号:
    20H04243
  • 财政年份:
    2020
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CHS: Small: Towards Next-Generation Large-Scale Nonlinear Deformable Simulation
CHS:小型:迈向下一代大规模非线性变形模拟
  • 批准号:
    2016414
  • 财政年份:
    2019
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
AF: Small: Collaborative Research: Effective Numerical Algorithms and Software for Nonlinear Eigenvalue Problems
AF:小型:协作研究:非线性特征值问题的有效数值算法和软件
  • 批准号:
    1812927
  • 财政年份:
    2018
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: Signal Processing for Nonlinear Diffractive Imaging: Acquisition, Reconstruction, and Applications
CIF:小型:协作研究:非线性衍射成像的信号处理:采集、重建和应用
  • 批准号:
    1813910
  • 财政年份:
    2018
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
AF: Small: Collaborative Research: Effective Numerical Algorithms and Software for Nonlinear Eigenvalue Problems
AF:小型:协作研究:非线性特征值问题的有效数值算法和软件
  • 批准号:
    1812695
  • 财政年份:
    2018
  • 资助金额:
    $ 33.68万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了