基于人声检测及分离的多版本流行音乐检索关键技术研究

批准号:
61171128
项目类别:
面上项目
资助金额:
60.0 万元
负责人:
李伟
依托单位:
学科分类:
F0117.多媒体信息处理
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
郭跃飞、冯瑞、肖川、汪竹蓉、朱碧磊、殷玥、薛敏
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
近年来,基于音频指纹技术的信号级音乐识别已经达到了很高的准确度,但是机器仍然无法像人类听觉那样准确地识别同一音乐的多个版本。本课题结合歌声检测和歌声分离技术来研究多版本音乐识别问题。研究内容分为以下五个方面:(1)采用与现有算法从细到粗检测歌声相反的思路,基于音乐结构分析并结合音乐领域知识从粗到细地进行乐句级歌声检测;(2)结合音乐领域知识,首次研究打击乐器对歌声检测性能的影响;(3)基于计算听觉场景分析CASA框架设计歌声分离算法,利用模糊分类与匹配在一定程度上解决音乐信号和声重叠这一挑战性的难题;(4)围绕歌声主旋律这一多版本音乐中最本质的不变因素,集成上边歌声检测和歌声分离算法,设计一种翻唱歌曲检索算法,为解决在歌曲结构发生变化时仍能正确识别这一研究难题提供一条新的思路。(5)建立公开的歌声检测和翻唱检索测试数据库,并通过集成以上研究成果实现演示系统。
英文摘要
基于音频指纹技术的信号级音乐识别已经达到了很高的准确度,但是机器仍然无法像人类听觉那样准确地识别同一音乐的多个版本。本课题结合歌声检测和歌声分离技术研究多版本音乐识别问题。主要贡献是:使用主动学习方法减少歌声检测中的人工标注;使用非负矩阵分解改进基于音调的歌声分离;基于多层频谱图分解进行单声道歌声分离;进行音乐引用、串烧歌曲中重复片段的检测;验证Chroma特征的鲁棒性;基于Chroma-based BOW特征进行多版本音乐识别。另外还资助了数个同领域的相关工作:如基于低阶Zernike矩的MP3压缩域音乐识别;基于频谱图SIFT描述子的鲁棒音乐识别;用递归图和状态空间嵌入改进的歌曲摘要检测;基于模糊逻辑的音乐内容认证等。四年时间中本研究完全达到了预期目标。在歌声检测、歌声分离、翻唱歌曲检索、鲁棒音乐识别、音频认证等方面取得了突出成绩。共获得授权专利1项,申请2项,发表论文15篇,其中在多媒体领域顶级会议ACM MM、音频领域顶级会议ICASSP、音频领域顶级期刊IEEE TASLP、音频领域权威期刊EURASIP JASMP、EURASIP JASP等上面在国内率先取得突破。创办全国声音与音乐计算研讨会,推荐MIR领域在国内的发展。毕业博士研究生1名,硕士研究生5人,获得教育部及上海市自然科学二等奖各一项,均排名第三。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2015
期刊:小型微型计算机系统
影响因子:--
作者:李晓强;王淞昕;李会永;李伟
通讯作者:李伟
DOI:--
发表时间:2014
期刊:计算机科学
影响因子:--
作者:张秀;李念祖;李伟
通讯作者:李伟
DOI:--
发表时间:2013
期刊:EURASIP Journal on Audio Speech and Music Processing
影响因子:2.4
作者:Li, Wei;Zhang, Xiu;Wang, Zhurong
通讯作者:Wang, Zhurong
DOI:--
发表时间:2014
期刊:小型微型计算机系统
影响因子:--
作者:沈迤淳;肖川;李伟
通讯作者:李伟
DOI:10.1186/1687-6180-2013-132
发表时间:2013-08
期刊:EURASIP Journal on Advances in Signal Processing
影响因子:1.9
作者:Wei Li;Chuan Xiao;Yaduo Liu
通讯作者:Wei Li;Chuan Xiao;Yaduo Liu
基于深度学习的音乐节拍及强拍跟踪技术研究
- 批准号:62171138
- 项目类别:面上项目
- 资助金额:57万元
- 批准年份:2021
- 负责人:李伟
- 依托单位:
介孔碳基非贵金属氢燃料电池催化材料的设计合成和性能研究
- 批准号:--
- 项目类别:--
- 资助金额:260万元
- 批准年份:2021
- 负责人:李伟
- 依托单位:
DNA甲基化边界漂移重塑增强子活性在肺癌脑转移中的作用研究
- 批准号:32000505
- 项目类别:青年科学基金项目
- 资助金额:24.0万元
- 批准年份:2020
- 负责人:李伟
- 依托单位:
核壳结构介孔半导体材料设计合成、结构调控和光电催化性能研究
- 批准号:21975050
- 项目类别:面上项目
- 资助金额:65.0万元
- 批准年份:2019
- 负责人:李伟
- 依托单位:
Necrosulfonamide通过抑制细胞焦亡防治老年性聋的实验研究
- 批准号:81900942
- 项目类别:青年科学基金项目
- 资助金额:18.0万元
- 批准年份:2019
- 负责人:李伟
- 依托单位:
非贵金属助催化剂修饰介孔黑二氧化钛体系的构建及光催化产氢性能研究
- 批准号:21603036
- 项目类别:青年科学基金项目
- 资助金额:21.0万元
- 批准年份:2016
- 负责人:李伟
- 依托单位:
音乐旋律提取关键技术研究及其在音乐借用识别中的应用
- 批准号:61671156
- 项目类别:面上项目
- 资助金额:58.0万元
- 批准年份:2016
- 负责人:李伟
- 依托单位:
音频指纹在音乐检索中的关键技术研究
- 批准号:60873255
- 项目类别:面上项目
- 资助金额:26.0万元
- 批准年份:2008
- 负责人:李伟
- 依托单位:
数字音频水印算法研究
- 批准号:60402008
- 项目类别:青年科学基金项目
- 资助金额:22.0万元
- 批准年份:2004
- 负责人:李伟
- 依托单位:
国内基金
海外基金
