课题基金基金详情
MDCT/ODFT域中的音频参数估计及其应用研究
结题报告
批准号:
61701391
项目类别:
青年科学基金项目
资助金额:
25.5 万元
负责人:
顿玉洁
依托单位:
学科分类:
F0111.信号理论与信号处理
结题年份:
2020
批准年份:
2017
项目状态:
已结题
项目参与者:
贺丽君、赵国帅、王珞、赖申其、周鑫、徐伟、种冲
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
在压缩域对音频信号进行处理与分析,避免了传统方法中的音频解码环节,降低系统复杂度和系统延迟,对媒体大数据时代的海量音频处理与分析具有重要意义。本项目研究在音频变换域MDCT/ODFT中进行参数估计的关键技术,并探讨其应用于压缩域音频处理与分析、压缩编码/参数分析一体化音频处理系统时的核心技术内容。研究内容:复杂模型下MDCT/ODFT域音频参数估计方法;MDCT/ODFT域音频特征参量提取方法;ODFT域音频多通道与高频带编码参量提取;压缩音频处理与分析仿真验证平台。创新点:结合实际音频信号特征,实现复杂模型条件下的参数估计方法;结合压缩域音频处理分析需求,实现压缩域音频特征参量提取;结合ODFT域分析的特征,实现压缩编码与信号分析一体化的低复杂度音频系统方案。本项目研究将提供有效的变换域信号参数估计方法,为压缩域音频处理与分析提供技术支持和实现方案,并探索新的音频处理平台框架。
英文摘要
Compressed domain audio signal processing and analysis are of vital significance for large scale audio processing because it can avoid the decoding modules required by conventional methods, helping to reduce the system complexity and latency. We plan to do research on the key techniques in parameter estimation methods in MDCT/ODFT domain that are used in audio compression. We also plan to study the key techniques that are used in compressed domain audio processing and analysis, and in building a unified audio compression and parameter extraction system. To be specific, our research is composed of the following three facets: 1) parameter estimation methods of audio signals with complex models in MDCT/ODFT domain; 2) characteristic parameter extraction for audio signals in MDCT/ODFT domain; 3) Multi-channel and high-frequency bands coding parameters extraction in ODFT domain; 4) simulation and verification platform for compressed audio processing and analysis. Innovation points are: 1) Propose parameter estimation methods for complex models that take the actual audio signal characteristics into account; 2) Propose compressed domain audio characteristic parameter extraction methods; 3) A solution for low-complexity audio processing platform with unified compression and signal analysis functions. Out research will provide effective transform domain signal parameter estimation methods, and it will provide the necessary technical supports and a valuable reference for audio signal processing and analysis in the compressed domain. Further more, it will explore a new audio processing platform.
本项目主要研究了在MDCT/ODFT变换域进行参数估计和分析的关键技术,并探讨将其应用于压缩域音频信号处理与分析、压缩编码/参数分析一体化音频处理系统时的核心技术内容。通过研究MDCT/ODFT域的正弦信号参数估计,为大数据时代海量数据处理需求背景下,对音频信号进行低复杂度处理与分析提供了关键技术支持。主要创新点包括:(1)在ODFT域参数估计研究方面,提出了一种高精度的基于指数衰减正弦模型的ODFT域参数估计方法;提出了现有算法从DFT域向ODFT域迁移的转换算法;提出了一种DFT域的高精度非迭代的频率估计算法。(2)在MDCT域参数估计研究方面,建立了正弦信号MDCT域分析的通用模型;提出了一种高效的直接在MDCT域进行正弦参数估计的估计算法;系统分析了现有算法从DFT/ODFT域向MDCT域迁移的核心与关键;(3)在一体化音频处理分析与压缩编码仿真验证平台建设方面,通过音频的参数化分析与重构,验证了平台在参数估计算法方面的功能;通过一体化系统的搭建,实现了音频处理与压缩编码的系统原型。以上工作为后续进一步研究奠定了良好的科研基础。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1049/el.2018.8019
发表时间:2019
期刊:Electronics Letters
影响因子:1.1
作者:Chen Zan;Hou Xingsong;Shao Ling;Wang Shidong
通讯作者:Wang Shidong
Compressive Sensing Multi-Layer Residual Coefficients for Image Coding
用于图像编码的压缩感知多层残差系数
DOI:10.1109/tcsvt.2019.2898908
发表时间:2020-04-01
期刊:IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY
影响因子:8.4
作者:Chen, Zan;Hou, Xingsong;Wang, Shidong
通讯作者:Wang, Shidong
Zero-VAE-GAN: Generating Unseen Features for Generalized and Transductive Zero-Shot Learning
Zero-VAE-GAN:为广义和传导性零样本学习生成看不见的特征
DOI:10.1109/tip.2020.2964429
发表时间:2020-01-01
期刊:IEEE TRANSACTIONS ON IMAGE PROCESSING
影响因子:10.6
作者:Gao, Rui;Hou, Xingsong;Shao, Ling
通讯作者:Shao, Ling
Kernel-attended residual network for single image super-resolution
用于单图像超分辨率的内核参与残差网络
DOI:10.1016/j.knosys.2020.106663
发表时间:2020-12
期刊:Knowledge-Based Systems
影响因子:8.8
作者:Yujie Dun;Zongyang Da;Shuai Yang;Yao Xue;Xueming Qian
通讯作者:Xueming Qian
DOI:https://doi.org/10.1016/j.knosys.2020.106663
发表时间:2020
期刊:Knowledge-Based Systems
影响因子:--
作者:Yujie Dun;Zongyang Da;Shuai Yang;Yao Xue;Xueming Qian
通讯作者:Xueming Qian
国内基金
海外基金