鲁棒的非特定环境声学事件检测关键技术研究
结题报告
批准号:
61071181
项目类别:
面上项目
资助金额:
32.0 万元
负责人:
韩纪庆
依托单位:
学科分类:
F0113.信息获取与处理
结题年份:
2013
批准年份:
2010
项目状态:
已结题
项目参与者:
邓世文、吕学琴、游大涛、马翼平、张茹、孟昕、王敏
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。鉴于声音的种类可粗分为语音和非语音,而以语音识别为代表的语音感知研究已较为丰富。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。拟解决如下关键问题:适合于声学事件检测的鲁棒特征的选择与提取、非特定环境声学事件的检测方法、与声学事件检测相适应的声音感知系统框架和评价方法。声学事件检测可广泛用于鲁棒语音识别及音频信息检索技术的前端,以及未来智能教室、智能医院等环境中声音信息的智能分析与处理。开展此方面的研究具有重要的理论意义和实用价值。
英文摘要
智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。.在本项目的实施过程中,不仅解决了申请中所提出的关键问题,而且还在具体研究过程中还扩展了相关的研究。在鲁棒特征提取方面:针对具有显著周期性的短时声学事件,提出了基于复指数字典稀疏分解的特征提取方法;针对周期性不显著的短时声学事件,提出了基于学习字典的特征提取方法;针对长时声学事件,提出了基于矩阵低秩约束的特征提取方法。研究表明这些方法都大大提高了不同特性的声学事件特征的鲁棒性。在检测方法方面:针对具有稳定统计分布的短时声学事件,提出了基于HMM修正MAP准则的帧检测方法;针对不具有稳定统计分布的短时声学事件,提出了基于核方法与Chernoff不等式的检测方法;针对具有稳定统计分布的长时声学事件,提出了基于异质混合模型的检测方法;针对不具有稳定统计分布的长时声学事件,提出了基于符号似然比多观测值检测方法;研究表明这些方法都大大提高了检测器的性能。.在本课题执行过程中已发表和录用论文19篇,其中国际刊物论文11篇,国际会议论文8篇。刊物论文被SCI收录9篇,其中包括本领域重要期刊:IEEE Transactions on Audio Speech and Language Processing上发表2篇,IEEE Signal Processing Letters发表1篇,IET Signal Processing发表1篇。EI收录9篇,其中包括本领域的重要会议:ICASSP 4篇,INTERSPEECH 2篇,ICONIP 1篇。同时,申请发明专利3项。研究成果超出了计划合同任务中的指标。上述成果也构成了《音频信息检索理论与技术》一书中的组成部分之一,该书已于2011年3月由科学出版社出版。此外,研究的部分内容也补充进了《语音信号处理(第二版)》,该书已于2013年4月由清华大学出版社出版。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
SPARSE BASED AUDITORY MODEL FOR ROBUST SPEAKER RECOGNITION
用于稳健说话人识别的基于稀疏的听觉模型
DOI:--
发表时间:--
期刊:International Journal of Pattern Recognition and Artificial Intelligence
影响因子:1.5
作者:Datao You;Jiqing Han;Tieran Zheng;Guibin Zheng
通讯作者:Guibin Zheng
DOI:10.1002/mma.2612
发表时间:2013-04
期刊:Mathematical Methods in the Applied Sciences
影响因子:2.9
作者:Xueqin Lv;Yue Gao
通讯作者:Xueqin Lv;Yue Gao
Fast Audio Retrieval Using Symbolized LSH Address Based on p-stable Distribution
基于p稳定分布的符号化LSH地址的快速音频检索
DOI:--
发表时间:2012
期刊:Journal of Information and Computational Science
影响因子:--
作者:Li Miao;Sun Rongkun;Han Jiqing
通讯作者:Han Jiqing
DOI:10.1145/2542182.2542197
发表时间:2013-12
期刊:ACM Transactions on Intelligent Systems and Technology (TIST)
影响因子:--
作者:Ziqiang Shi;Jiqing Han;Tieran Zheng
通讯作者:Ziqiang Shi;Jiqing Han;Tieran Zheng
Likelihood ratio sign test for voice activity detection
用于语音活动检测的似然比符号测试
DOI:--
发表时间:2012
期刊:IET Signal Processing
影响因子:1.7
作者:Shiwen Deng;Jiqing Han
通讯作者:Jiqing Han
面向领域不匹配的鲁棒说话人识别技术研究
  • 批准号:
    62376071
  • 项目类别:
    面上项目
  • 资助金额:
    50万元
  • 批准年份:
    2023
  • 负责人:
    韩纪庆
  • 依托单位:
复杂声学环境下声学事件检测与音频场景识别方法研究
  • 批准号:
    U1736210
  • 项目类别:
    联合基金项目
  • 资助金额:
    256.0万元
  • 批准年份:
    2017
  • 负责人:
    韩纪庆
  • 依托单位:
基于内在与潜在语义特征的声音段落级语义识别方法研究
  • 批准号:
    61471145
  • 项目类别:
    面上项目
  • 资助金额:
    86.0万元
  • 批准年份:
    2014
  • 负责人:
    韩纪庆
  • 依托单位:
行车环境听觉模型及声音处理关键技术
  • 批准号:
    91120303
  • 项目类别:
    重大研究计划
  • 资助金额:
    270.0万元
  • 批准年份:
    2011
  • 负责人:
    韩纪庆
  • 依托单位:
基于内容的音频信息检索关键技术研究
  • 批准号:
    60672163
  • 项目类别:
    联合基金项目
  • 资助金额:
    28.0万元
  • 批准年份:
    2006
  • 负责人:
    韩纪庆
  • 依托单位:
基于子词网格的汉语语音检索关键技术研究
  • 批准号:
    60575030
  • 项目类别:
    面上项目
  • 资助金额:
    22.0万元
  • 批准年份:
    2005
  • 负责人:
    韩纪庆
  • 依托单位:
数字音频水印系统的基本模型和算法研究
  • 批准号:
    60173044
  • 项目类别:
    面上项目
  • 资助金额:
    18.0万元
  • 批准年份:
    2001
  • 负责人:
    韩纪庆
  • 依托单位:
心理紧张和应力影响下Robust语音识别方法研究
  • 批准号:
    60085001
  • 项目类别:
    专项基金项目
  • 资助金额:
    14.0万元
  • 批准年份:
    2000
  • 负责人:
    韩纪庆
  • 依托单位:
国内基金
海外基金