行车环境听觉模型及声音处理关键技术

批准号:
91120303
项目类别:
重大研究计划
资助金额:
270.0 万元
负责人:
韩纪庆
依托单位:
学科分类:
F0111.信号理论与信号处理
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
刘文举、郑铁然、丁鹏、郑贵滨、李鹏、陈月华、孟猛、王伟、韦玮
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
课题将围绕本重大研究计划的总体目标,根据本年度项目指南中的研究方向,开展行驶中无人驾驶车辆对车内外声音的自动检测、实时识别及理解方面的关键技术研究,为无人车的智能行为决策提供辅助的听觉信息。课题拟重点解决如下关键问题:环境变化复杂情况下声音信号的有效拾取、噪声消除及声源定位;基于听觉认知的鲁棒声音特征提取及有效声音感知与环境状况理解;交通广播语音识别和信息抽取;并在此基础上构建行车环境下的听觉模型。通过课题的研究,拟提出一系列行车环境下普适的自动声音感知与理解的理论与方法;并借助无人车这一典型应用背景,探索特定场景和特定目标下听觉信息的认知机理。力争使研究成果达到国际先进水平,提升我国在视听觉信息处理领域的整体研究实力。
英文摘要
本项目围绕重大研究计划的总体目标,按照研究计划书设定的研究内容,开展了无人车行车环境下车内外声音的自动检测、实时识别及理解方面的关键技术研究。为无人车的智能行为决策提供辅助的听觉信息。. 在项目的实施过程中,不仅解决了计划书中所提出的关键问题,而且还在具体研究过程中扩展了相关的研究。在基于麦克风阵列的声源定位和信号分离方面,首先设计并制作了多通道麦克风阵列硬件设备;其次提出了基于变换域分析的声源定位算法;接着提出了基于隐马尔科夫随机场关联建模的信号分离方法。在基于麦克风阵列的噪声消除和信号增强方面,提出了基于深度神经网络后滤波的麦克风阵列噪声消除框架,能在消除噪声的同时,有效控制信号畸变。在基于耳蜗非线性与主动增益特性的鲁棒特征提取方面,提出了一种能有效仿真耳蜗非线性处理机制的声学特征提取方法,其鲁棒性明显优于传统的声学特征。在车辆周边及车内声学事件检测方面,首先提出了基于基频的声音分割方法;其次对基于高斯混合模型的建模方法进行了改进,提出了伪高斯混合模型方法;接着提出了异质混合模型方法,以适应实际应用中多种不同数据分布的建模问题。最后,提出了一种基于多尺度RBF核SVM的声学事件检测方法。在基于声音事件序列的场景识别方面,首先提出了基于低秩矩阵的特征表示方法和基于低秩张量的特征表示方法;其次提出了基于低秩支持向量机的音频场景识别方法;接着,提出了基于背景声的最小噪声统计量来识别音频场景的方法。在交通广播提示语音的识别与信息抽取方面,设计并实现了一个服务于无人车的交通广播语音识别与抽取系统。在无人车声音感知和理解系统构建方面,提出了一般化的无人车听觉能力模型和实现该听觉能力的技术框架。同时,构建了行车环境下的声音感知和理解原型系统,并在实际无人车平台上进行了测试,各项功能指标和性能指标达到要求。 . 项目组共发表或录用学术论文66篇,其中18篇进入SCI检索源,64篇进入EI检索源,申请专利11项,与多个国家的学者开展了学术交流与合作。培养博士研究生17名,硕士研究生20名。由2013年清华出版社出书一部。另一本专门讨论声学事件检测理论与方法的专著即将在2016年由科学出版社出版。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
The analysis of the simplification from the ideal ratio to binary mask in signal-to-noise ratio sense
信噪比意义上理想比率到二元掩模的简化分析
DOI:10.1016/j.specom.2013.12.002
发表时间:2014-04
期刊:Speech Communication
影响因子:3.2
作者:Shan Liang;Wenju Liu;Wei Jiang;Wei Xue
通讯作者:Wei Xue
DOI:--
发表时间:2012
期刊:声学学报(中文版)
影响因子:--
作者:倪崇嘉;刘文举;徐波
通讯作者:徐波
Noise Robust Direction of Arrival Estimation for Speech Source With Weighted Bispectrum Spatial Correlation Matrix
加权双谱空间相关矩阵的语音源到达估计的噪声鲁棒方向
DOI:10.1109/jstsp.2015.2416686
发表时间:2015-08
期刊:IEEE Journal of Selected Topics in Signal Processing
影响因子:7.5
作者:Xue, Wei;Liu, Wenju;Liang, Shan
通讯作者:Liang, Shan
Likelihood ratio sign test for voice activity detection
用于语音活动检测的似然比符号测试
DOI:--
发表时间:2012
期刊:IET Signal Processing
影响因子:1.7
作者:Shiwen Deng;Jiqing Han
通讯作者:Jiqing Han
DOI:10.1016/j.ins.2015.03.010
发表时间:2015-07
期刊:Information Sciences
影响因子:8.1
作者:He, Yongjun;Chen, Deyun;Sun, Guanglu;Han, Jiqing
通讯作者:Han, Jiqing
面向领域不匹配的鲁棒说话人识别技术研究
- 批准号:62376071
- 项目类别:面上项目
- 资助金额:50万元
- 批准年份:2023
- 负责人:韩纪庆
- 依托单位:
复杂声学环境下声学事件检测与音频场景识别方法研究
- 批准号:U1736210
- 项目类别:联合基金项目
- 资助金额:256.0万元
- 批准年份:2017
- 负责人:韩纪庆
- 依托单位:
基于内在与潜在语义特征的声音段落级语义识别方法研究
- 批准号:61471145
- 项目类别:面上项目
- 资助金额:86.0万元
- 批准年份:2014
- 负责人:韩纪庆
- 依托单位:
鲁棒的非特定环境声学事件检测关键技术研究
- 批准号:61071181
- 项目类别:面上项目
- 资助金额:32.0万元
- 批准年份:2010
- 负责人:韩纪庆
- 依托单位:
基于内容的音频信息检索关键技术研究
- 批准号:60672163
- 项目类别:联合基金项目
- 资助金额:28.0万元
- 批准年份:2006
- 负责人:韩纪庆
- 依托单位:
基于子词网格的汉语语音检索关键技术研究
- 批准号:60575030
- 项目类别:面上项目
- 资助金额:22.0万元
- 批准年份:2005
- 负责人:韩纪庆
- 依托单位:
数字音频水印系统的基本模型和算法研究
- 批准号:60173044
- 项目类别:面上项目
- 资助金额:18.0万元
- 批准年份:2001
- 负责人:韩纪庆
- 依托单位:
心理紧张和应力影响下Robust语音识别方法研究
- 批准号:60085001
- 项目类别:专项基金项目
- 资助金额:14.0万元
- 批准年份:2000
- 负责人:韩纪庆
- 依托单位:
国内基金
海外基金
