Deep neural network-based speech enhancement for robust speech recognition in smart home device

基于深度神经网络的语音增强,可在智能家居设备中实现稳健的语音识别

基本信息

  • 批准号:
    515072-2017
  • 负责人:
  • 金额:
    $ 6.74万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Collaborative Research and Development Grants
  • 财政年份:
    2019
  • 资助国家:
    加拿大
  • 起止时间:
    2019-01-01 至 2020-12-31
  • 项目状态:
    已结题

项目摘要

Human-machine interfaces based on natural speech have advanced to the stage where previously unthinkable applications are becoming part of our daily life. Speech interfaces not only facilitate human-machine interactions but also significantly enhance the efficiency of home automation, which is a key driver of internet of things (IoT). Smart home devices (SHD) are now commercially available that allow users to control their home gears remotely and access Web-based information sources. These intelligent assistants can respond in real-time to human voice commands via automatic speech recognition (ASR). However, for SHD to operate satisfactorily under real-world conditions, they must be robust to acoustic noise and reverberation, a critical problem whose solution calls for new speech processing technologies. The long-term goal of the project is to develop an integrated speech enhancement (SE) system based on deep neural networks (DNN) to support two essential SHD functions: keyword spotting and cloud-based ASR. Over its 3-year duration, the project aims to achieve the following objectives: develop new feature sets for the representation of noisy speech; design improved DNN core engines better suited to the SE task; implement a complete DNN-based SE system that is robust to noise and reverberation; and finally, evaluate its performance within a multi-microphone SHD context. This proposed research is an extension of an on-going NSERC CRD project with industrial partner Microsemi. During the past two years, our team has developed state-of-the-art SE algorithms that display excellent performance when tested on human listeners. However, these algorithms are not optimally designed for use as pre-processors to ASR, as needed in the new line of integrated circuits (IC) being currently developed by Microsemi for voice-driven SHD. The proposed research will provide our sponsor with cost-effective and innovative SE solutions for use in their IC products, boosting its competitiveness on the marketplace. In addition to technology transfer, the project will promote the research and the training of HQP in intelligent speech processing at McGill and Concordia.
基于自然语音的人机界面已经发展到了以前不可想象的应用程序正在成为我们日常生活的一部分的阶段。语音接口不仅促进了人机交互,还显著提高了家庭自动化的效率,这是物联网(IoT)的关键驱动力。智能家居设备(SHD)现在已经上市,允许用户远程控制他们的家庭设备并访问基于Web的信息源。这些智能助手可以通过自动语音识别(ASR)实时响应人类语音命令。然而,SHD令人满意地运行在现实世界的条件下,他们必须是强大的声学噪声和混响,一个关键的问题,其解决方案需要新的语音处理技术。该项目的长期目标是开发一个基于深度神经网络(DNN)的集成语音增强(SE)系统,以支持两个基本的SHD功能:关键字识别和基于云的ASR。在为期3年的时间里,该项目旨在实现以下目标:开发用于表示嘈杂语音的新功能集;设计更适合SE任务的改进的DNN核心引擎;实现一个完整的基于DNN的SE系统,该系统对噪声和混响具有鲁棒性;最后,在多麦克风SHD环境中评估其性能。这项拟议的研究是与工业合作伙伴Microsemi正在进行的NSERC CRD项目的延伸。在过去的两年中,我们的团队开发了最先进的SE算法,在人类听众身上测试时表现出色。然而,这些算法并没有被最佳地设计为用作ASR的预处理器,而这正是Microsemi目前正在开发的用于语音驱动SHD的新系列集成电路(IC)所需要的。拟议的研究将为我们的赞助商提供具有成本效益和创新的SE解决方案,用于其IC产品,提高其在市场上的竞争力。除了技术转让外,该项目还将促进麦吉尔大学和康考迪亚大学在智能语音处理方面的研究和HQP培训。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Champagne, Benoit其他文献

Multi-State Second-Order Nonlinear Optical Switches Incorporating One to Three Benzazolo-Oxazolidine Units: A Quantum Chemistry Investigation.
  • DOI:
    10.3390/molecules27092770
  • 发表时间:
    2022-04-26
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Beaujean, Pierre;Sanguinet, Lionel;Rodriguez, Vincent;Castet, Frederic;Champagne, Benoit
  • 通讯作者:
    Champagne, Benoit
TDDFT investigation of the optical properties of cyanine dyes
  • DOI:
    10.1016/j.cplett.2006.05.009
  • 发表时间:
    2006-07-03
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Champagne, Benoit;Guillaume, Maxime;Zutterman, Freddy
  • 通讯作者:
    Zutterman, Freddy
Signature of multiradical character in second hyperpolarizabilities of rectangular graphene nanoflakes
  • DOI:
    10.1016/j.cplett.2010.03.013
  • 发表时间:
    2010-04-09
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Nagai, Hiroshi;Nakano, Masayoshi;Champagne, Benoit
  • 通讯作者:
    Champagne, Benoit
Assessing Density Functional Theory Approaches for Predicting the Structure and Relative Energy of Salicylideneaniline Molecular Switches in the Solid State
  • DOI:
    10.1021/acs.jpcc.7b00580
  • 发表时间:
    2017-03-30
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Quertinmont, Jean;Carletta, Andrea;Champagne, Benoit
  • 通讯作者:
    Champagne, Benoit
X Polarizabilities and hyperpolarizabilities

Champagne, Benoit的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Champagne, Benoit', 18)}}的其他基金

Array Signal Processing Techniques for Terahertz Communications and Sensing
用于太赫兹通信和传感的阵列信号处理技术
  • 批准号:
    RGPIN-2022-03678
  • 财政年份:
    2022
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Discovery Grants Program - Individual
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    RGPIN-2017-04223
  • 财政年份:
    2021
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Discovery Grants Program - Individual
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    DGDND-2017-00019
  • 财政年份:
    2020
  • 资助金额:
    $ 6.74万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    RGPIN-2017-04223
  • 财政年份:
    2020
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Discovery Grants Program - Individual
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    DGDND-2017-00019
  • 财政年份:
    2019
  • 资助金额:
    $ 6.74万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Deep Learning Technologies for Acoustic Echo Cancellation in Dynamic Environments
用于动态环境中声学回声消除的深度学习技术
  • 批准号:
    543348-2019
  • 财政年份:
    2019
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Engage Grants Program
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    RGPIN-2017-04223
  • 财政年份:
    2019
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Discovery Grants Program - Individual
Deep neural network-based speech enhancement for robust speech recognition in smart home device
基于深度神经网络的语音增强,可在智能家居设备中实现稳健的语音识别
  • 批准号:
    515072-2017
  • 财政年份:
    2018
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Collaborative Research and Development Grants
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    DGDND-2017-00019
  • 财政年份:
    2018
  • 资助金额:
    $ 6.74万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Signal Prosessing Techniques for 5G Wireless and mm-Wave Communications
5G 无线和毫米波通信的信号处理技术
  • 批准号:
    RGPIN-2017-04223
  • 财政年份:
    2018
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

脐带间充质干细胞微囊联合低能量冲击波治疗神经损伤性ED的机制研究
  • 批准号:
    82371631
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
亚低温调控颅脑创伤急性期神经干细胞Mpc2/Lactate/H3K9lac通路促进神经修复的研究
  • 批准号:
    82371379
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于再生运动神经路径优化Agrin作用促进损伤神经靶向投射的功能研究
  • 批准号:
    82371373
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
Neural Process模型的多样化高保真技术研究
  • 批准号:
    62306326
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
声致离子电流促进小胶质细胞M2极化阻断再生神经瘢痕退变免疫机制
  • 批准号:
    82371973
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
LIPUS响应的弹性石墨烯多孔导管促进神经再生及其机制研究
  • 批准号:
    82370933
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
生理/病理应激差异化调控肝再生的“蓝斑—中缝”神经环路机制
  • 批准号:
    82371517
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
弓状核介导慢性疼痛引起动机下降的神经环路机制及rTMS干预研究
  • 批准号:
    82371536
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
听觉刺激特异性调控情绪的神经环路机制研究
  • 批准号:
    82371516
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
TAG1/APP信号通路调控的miRNA及其在神经前体细胞增殖和分化中的作用机制
  • 批准号:
    31171313
  • 批准年份:
    2011
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似海外基金

CRII: RI: Deep neural network pruning for fast and reliable visual detection in self-driving vehicles
CRII:RI:深度神经网络修剪,用于自动驾驶车辆中快速可靠的视觉检测
  • 批准号:
    2412285
  • 财政年份:
    2024
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Standard Grant
Development of data-driven multiple sound spot synthesis technology based on deep generative neural network models
基于深度生成神经网络模型的数据驱动多声点合成技术开发
  • 批准号:
    23K11177
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CISE-ANR: Small: Evolutional deep neural network for resolution of high-dimensional partial differential equations
CISE-ANR:小型:用于求解高维偏微分方程的进化深度神经网络
  • 批准号:
    2214925
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Standard Grant
Imaging Epilepsy Sources with Biophysically Constrained Deep Neural Networks
使用生物物理约束的深度神经网络对癫痫源进行成像
  • 批准号:
    10655833
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
High-performance deep neural networks for medical image analysis
用于医学图像分析的高性能深度神经网络
  • 批准号:
    10723553
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
Linking endotype and phenotype to understand COPD heterogeneity via deep learning and network science
通过深度学习和网络科学将内型和表型联系起来以了解 COPD 异质性
  • 批准号:
    10569732
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
Ultra-precision clinical imaging and detection of Alzheimers Disease using deep learning
使用深度学习进行超精密临床成像和阿尔茨海默病检测
  • 批准号:
    10643456
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
Uncovering Nodal signaling and transcription factor interactions in somitic mesoderm development using single-cell deep learning methods
使用单细胞深度学习方法揭示体细胞中胚层发育中的节点信号传导和转录因子相互作用
  • 批准号:
    10749611
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
Construction of a deep graph neural network that prevents over-smoothing
构建防止过度平滑的深度图神经网络
  • 批准号:
    23K11241
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Elements: A Deep Neural Network-based Drone (UAS) Sensing System for 3D Crop Structure Assessment
Elements:用于 3D 作物结构评估的基于深度神经网络的无人机 (UAS) 传感系统
  • 批准号:
    2334690
  • 财政年份:
    2023
  • 资助金额:
    $ 6.74万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了