噪声环境下基于深度学习的低速率语音编码技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61701535
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    21.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0108.多媒体通信
  • 结题年份:
    2020
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2020-12-31

项目摘要

With the decrease of speech coding rate, the traditional speech coding model and methods can not guarantee high quality for speech coding. Especially, there are many kinds of background noises and interrupt signals in the battle field and the bandwidth resource is very limited, which results in many estimating and quantizing errors for speech coding parameters, such as linear prediction coefficients and pitch, under the traditional source-filter speech coding paradigm, which leads to severe degradation of speech quality. Recent years witnessed many breakthroughs for speech recognition and speech enhancement by using deep learning technology, however, it is rarely exploited for noise robust speech coding task. Therefore, this study tries to research the difficult problem of anti-noise low bit rate speech coding by exploiting the human auditory characteristics under the deep learning paradigm. We will study the new anti-noise speech coding model by using the stacked denoising auto-encoder model, propose new robust extracting and quantizing methods for speech coding parameters, constitute a new scheme for anti-noise speech coding at low bit rate, explore a new method for the fusion of speech coding and speech denoising. This study benefits for the research of the mechanism of speech production and perception of humans. It also benefits for solving some difficult problems in the field of satellite speech communication and short-wave speech communication, which is of significance and practical values.
随着编码速率的降低,传统的语音编码模型和方法难以实现高质量语音编码。特别是战场环境下,信道资源十分有限,各种嘈杂的背景噪声大量存在且干扰密集、繁杂而又多变,这使得传统声源—滤波器语音编码框架下线性预测系数、基音周期等编码参数的提取和量化过程都会产生较大偏差,并导致编码语音质量严重下降。近年来,深度学习在语音识别、语音增强等领域取得了许多突破性进展,然而在抗噪语音编码领域的应用研究却极少涉及。为此,本项目针对噪声环境下高质量低速率语音压缩编码难题,结合人耳的听觉感知特性,在深度学习的框架下应用堆叠降噪自编码机建立抗噪低速率语音编码新模型、提出语音编码参数鲁棒提取和高效量化新方法,构建适用于低速率语音传输的抗噪语音编码新方案,探索出语音降噪和语音编码融合的新途径。项目研究有助于深化认识语音信号的产生和感知机理,有助于解决军用卫星、短波等语音通信系统面临的现实难题,具有重要的理论意义和实用价值。

结项摘要

本课题面向噪声环境下语音通信场景,应用深度学习理论方法,突破传统“声源—滤波器”语音编码框架,研究涵盖“编码模型构建、编码参数提取、编码参数量化、编码语音重构”等多个方面的低速率语音编码理论和应对背景噪声的语音增强技术。首先,提出了一种“数据驱动”模式下的新型语音编码模型即Deep Vocoder模型;其次,针对Deep Vocoder模型中的语音编码参数高效量化问题,提出了一种基于分析合成策略的编码参数高效量化方法即AbS VQ方法,有效提升了参数量化质量;再次,针对实际语音通信系统需求,在Deep Vocoder模型和AbS VQ基础上,通过合理设置语音分析帧长、深度神经网络结构、编码参数的量化比特分配方案等,提出了一种匹配实际语音通信系统的新型低速率语音编码新方案,编码速率涵盖600~2400 bit/s,编码语音质量与MELPe算法相比具有优势;第四,针对16kHz宽带语音压缩编码问题,基于WaveGlow深度生成模型改进MFCC声码器,通过对MFCCs的高效量化仿真实现了1000~2000 bit/s低速率语音编码;最后,针对噪声问题,提出了深度学习与稀疏低秩、非负矩阵分解等相互融合的语音增强方法,为噪声环境下语音编码提供了有效的前端处理技术。通过项目研究,课题组在基于深度学习的新型语音编码模型框架、编码参数高效量化技术、编码语音重构方法以及语音增强新技术等方面均取得了一些成果,为深度神经网络在语音编码领域中的应用提供了理论方法,为噪声环境下低速率语音编码技术提供了一种新的实现途径。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(4)
专利数量(0)
利用部分采样的数字混合信号单通道盲分离算法
  • DOI:
    10.16337/j.1004-9037.2019.06.006
  • 发表时间:
    2019
  • 期刊:
    数据采集与处理
  • 影响因子:
    --
  • 作者:
    马欢;郭勇;吴广恩;闵刚;张长青
  • 通讯作者:
    张长青
Steganalysis of content-adaptive JPEG steganography based on scale co-occurrence matrix with diverse quantization
基于不同量化尺度共生矩阵的内容自适应JPEG隐写分析
  • DOI:
    10.1117/1.jei.27.6.063004
  • 发表时间:
    2018-11
  • 期刊:
    Journal of Electronic Imaging
  • 影响因子:
    1.1
  • 作者:
    Xu Xiaoyan;Song Xiaofeng;Yang Chunfang;Zhao Weiwei;Zhao Rongcai
  • 通讯作者:
    Zhao Rongcai
Deep Neural Network Based Monaural Speech Enhancement with Low-Rank Analysis and Speech Present Probability
基于深度神经网络的单声道语音增强,具有低秩分析和语音呈现概率
  • DOI:
    10.1587/transfun.e101.a.585
  • 发表时间:
    2018-03
  • 期刊:
    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  • 影响因子:
    --
  • 作者:
    Wenhua SHI;Xiongwei ZHANG;Xia ZOU;Meng SUN;Wei HAN;Li LI;Gang MIN
  • 通讯作者:
    Gang MIN
语音去混响技术的研究进展与展望
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    数据采集与处理
  • 影响因子:
    --
  • 作者:
    张雄伟;李轶南;郑昌艳;曹铁勇;孙蒙;闵刚
  • 通讯作者:
    闵刚

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于线性预测分析和差分变换的语音信号压缩感知
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    电子与信息学报
  • 影响因子:
    --
  • 作者:
    高悦;陈砚圃;闵刚;杜佳
  • 通讯作者:
    杜佳
基于感知掩蔽深度神经网络的单通道语音增强方法
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    韩伟;张雄伟;闵刚;张启业
  • 通讯作者:
    张启业
ADMM稀疏非负矩阵分解语音增强算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    胡永刚;张雄伟;邹霞;闵刚;张立伟;王健
  • 通讯作者:
    王健
能量收集分布式检测系统中基于门限的节点能量管理策略
  • DOI:
    10.3969/j.issn.1004-1699.2020.02.004
  • 发表时间:
    2020
  • 期刊:
    传感技术学报
  • 影响因子:
    --
  • 作者:
    刘飞;刘向阳;闵刚
  • 通讯作者:
    闵刚
改进贝叶斯非负矩阵分解的语音增强算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    解放军理工大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    张立伟;张雄伟;胡永刚;闵刚;李轶南
  • 通讯作者:
    李轶南

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码