基于深度学习的自然图像先验模型及高效视频编码研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872116
  • 项目类别:
    面上项目
  • 资助金额:
    64.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Natural image and video data contain rich hierarchical and structured information. Human brain provides basic guarantee for understanding and cognition by effectively mining and modeling the general rule of natural images. Based on the understanding of the mechanism of human vision in the pathway of vision information transmission and human vision characters, our project tries to give summarization the general laws of the nature images corresponding to the human vision perception process, especially the deep learning based prior model as well as the corresponding key techniques in the video coding. The dominant contents include: exploring the general rule of the temporal and spatial context information of natural image and its optimal expression, developing effective deep learning based prior and the image prior models fusion strategy. Accordingly, we will focus on the problems in the video coding frameworks, and propose the method of deep learning based high quality images reconstruction and reliable quality for analysis and classification in the condition of low ration; these measures can be applied to break through the independence of video coding and video analysis, which are expected to make contribution to the future applications.
自然图像和视频数据中蕴含着丰富的层次化、结构化关联信息,人类大脑通过有效挖掘和建模自然图像的一般规律,为理解和认知提供根本保障。该项研究在理解与总结人类视觉系统的机理基础上,研究视觉先验深度模型及基于深度学习的视频编码理论与方法,完成以下目标:以深度学习为手段,兼顾计算视觉层面的识别与理解,挖掘自然图像时空上下文信息一般规律及其优化表达,实现融合图像先验深度模型的图像高效增强,建立并完善、普适的自然图像先验深度模型学习策略;进而研究视觉信息感知、语义层面上失真度量方法,以此为基础构建基于视觉特性的率失真模型,以及基于深度学习的快速帧内帧间预测,适用于深度网络编码的熵编码方法;最终综合以上,选择合理的视觉先验深度模型介入的途径与方式,研究基于深度学习的图像和视频数据的压缩编码框架,为视频智能应用奠定理论和技术基础。

结项摘要

自然图像和视频数据中蕴含着丰富的层次化、结构化关联信息,人类大脑通过挖掘和建模自然图像的一般规律,为理解和认知提供根本保障。本项目主要研究视觉先验深度模型及基于深度学习的视频编码理论与方法。具体而言,以深度学习为手段,兼顾计算视觉层面的识别与理解,挖掘自然图像时空上下文信息一般规律及其优化表达,实现融合图像先验深度模型的图像高效增强,建立并完善普适的自然图像先验深度模型学习策略;研究视觉信息感知、语义层面上失真度量方法,以此为基础构建基于视觉特性的率失真模型,以及基于深度学习的快速帧内帧间预测方法。.通过上述研究,本项目在以下几个方面取得重要成果:1. 在基于深度网络的压缩感知研究中,我们首先提出了图像压缩感知方法CSNet,CSNet首次利用深度网络联合优化采样矩阵和重建,大幅度提高了重建质量并极大地减少了计算复杂度。在此基础上,提出了可伸缩压缩感知方法SCSNet,SCSNet只需要训练一个模型就可以实现任意采样率下的可伸缩图像采样和重建。最后,将上述方法扩展到视频压缩感知,提出了视频压缩感知方法VCSNet。2. 在基于深度学习的视频编码研究中,分别针对帧内预测和帧间预测,提出了使用深度网络的MSCNN和NNIP方法,较大地提升了视频编码的编码效率。3. 在3D Mesh和点云数据的建模及增强研究中,我们首先提出了基于图的特征保持的法向量滤波方法:GGNF。其次,我们首次将深度网络引入到3D Mesh去噪任务,提出了基于学习的Mesh法向量滤波方法:NormalNet。最后,针对3D点云,我们提出了点云滤波网络PointFilterNet,通过将滤波与深度学习相结合完成点云去噪。上述方法较好地提升了3D数据的质量。.以上成果的取得推动了压缩感知技术的发展,为基于深度学习的视频编码应用提供了技术基础,并为3D数据建模与增强提供了高效解决方案。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(0)
Video Compressed Sensing Using a Convolutional Neural Network
使用卷积神经网络的视频压缩感知
  • DOI:
    10.1109/tcsvt.2020.2978703
  • 发表时间:
    2021-02-01
  • 期刊:
    IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY
  • 影响因子:
    8.4
  • 作者:
    Shi, Wuzhen;Liu, Shaohui;Zhao, Debin
  • 通讯作者:
    Zhao, Debin
Image Compressed Sensing Using Convolutional Neural Network
使用卷积神经网络的图像压缩感知
  • DOI:
    10.1109/tip.2019.2928136
  • 发表时间:
    2020-01-01
  • 期刊:
    IEEE TRANSACTIONS ON IMAGE PROCESSING
  • 影响因子:
    10.6
  • 作者:
    Shi, Wuzhen;Jiang, Feng;Zhao, Debin
  • 通讯作者:
    Zhao, Debin
PointFilterNet: A Filtering Network for Point Cloud Denoising
PointFilterNet:点云去噪的过滤网络
  • DOI:
    10.1109/tcsvt.2022.3207789
  • 发表时间:
    2023-03
  • 期刊:
    IEEE Transactions on Circuits and Systems for Video Technology
  • 影响因子:
    8.4
  • 作者:
    Xingtao Wang;Xiaopeng Fan;Debin Zhao
  • 通讯作者:
    Debin Zhao
Visual Relationship Embedding Network for Image Paragraph Generation
用于图像段落生成的视觉关系嵌入网络
  • DOI:
    10.1109/tmm.2019.2954750
  • 发表时间:
    2020
  • 期刊:
    IEEE Transactions on Multimedia
  • 影响因子:
    7.3
  • 作者:
    Wenbin Che;Xiaopeng Fan;Ruiqin Xiong;Debin Zhao
  • 通讯作者:
    Debin Zhao
Image Compressed Sensing Using Non-Local Neural Network
使用非局部神经网络的图像压缩感知
  • DOI:
    10.1109/tmm.2021.3132489
  • 发表时间:
    2023-01-01
  • 期刊:
    IEEE TRANSACTIONS ON MULTIMEDIA
  • 影响因子:
    7.3
  • 作者:
    Cui, Wenxue;Liu, Shaohui;Zhao, Debin
  • 通讯作者:
    Zhao, Debin

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

Low-Complexity Encoder Framework for Window-Level Rate Control Optimization
用于窗口级速率控制优化的低复杂度编码器框架
  • DOI:
    10.1109/tie.2012.2190960
  • 发表时间:
    2013-05
  • 期刊:
    IEEE Transactions on Industrial Electronics
  • 影响因子:
    7.7
  • 作者:
    徐龙;邝得互;张云;赵德斌
  • 通讯作者:
    赵德斌
Effort Analysis in Signer-Independent Sign Gestures
独立于手语者的手语手势的力度分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Journal of Experimental & Theoretical Artificial Intelligence
  • 影响因子:
    2.2
  • 作者:
    陈熙霖;姜峰;高文;姚鸿勋;赵德斌
  • 通讯作者:
    赵德斌
结合HMM和SPSM的手语识别方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    王春立;赵德斌;周宇;陈熙霖;高文
  • 通讯作者:
    高文
基于统计的SVC层间编码快速模式决策算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    张昕;张永兵;赵德斌
  • 通讯作者:
    赵德斌
基于感知视觉重要性的立体图像质量评价
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    智能系统学报
  • 影响因子:
    --
  • 作者:
    姜峰;郭美思;刘绍辉;赵德斌
  • 通讯作者:
    赵德斌

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

赵德斌的其他基金

深度压缩感知和视频编码
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
深度压缩感知和视频编码
  • 批准号:
    62272128
  • 批准年份:
    2022
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
基于统计建模和稀疏表示的图像视频增强表达和高效编码
  • 批准号:
    61272386
  • 批准年份:
    2012
  • 资助金额:
    81.0 万元
  • 项目类别:
    面上项目
无线分布式环境下视频信息的协同描述与智能传输
  • 批准号:
    60736043
  • 批准年份:
    2007
  • 资助金额:
    180.0 万元
  • 项目类别:
    联合基金项目
多视点视频的表达与交互
  • 批准号:
    60672088
  • 批准年份:
    2006
  • 资助金额:
    22.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码