基于结构化深度学习的场景理解

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872364
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0210.计算机图像视频处理与多媒体技术
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

In this proposal, we aim to systematically study on structured deep learning based scene understanding. We propose to design proper deep neural networks, in order to overcome the shortcomings of the traditional models on the lack of ability on image feature representation. We integrate deep neural networks and probabilistic graphical models to study the structured deep learning problem. we propose a model which combines convolutional neural networks (CNN) and continuous conditional random fields (CCRF) in a unified deep learning framework. CNN can extract rich related features from image, and CCRF can optimize the output of CNN according to the position and color information of the image pixels. We also propose a model to fuse sparse known labels. By using these known labels, we can provide our model a few relatively accurate depth value as a reference, and largely narrow down the range of reasonable depth value of other pixels. Thus the model can reduce the ambiguity of mapping a single RGB image into depth map to some extent. We investigate the multi-task learning problem on both depth estimation and semantic segmentation. By addressing the problems studied in this proposal, the vision based scene understanding theory and technique can be further developed.
本项目旨在研究基于结构化深度学习的图像场景理解问题,通过合理设计和架构深度学习网络模型,克服传统方法在图像特征表达能力方面的不足;将深度学习模型与概率图模型相结合,研究统一的结构化深度学习框架,解决传统深度学习模型输出缺乏结构化约束、空间结构信息丢失的问题;面向大规模应用数据,研究结构化输出模型的快速推断方法,以避免巨大的计算代价;在深度学习模型中引入可以通过较低成本获取的稀疏先验信息,研究先验信息的融合方法,以减少单幅图像到深度图之间映射的不确定性。研究图像的深度估计和语义分割的多任务学习,实现两个任务的共同增强。本项目的研究将促进基于视觉的场景理解理论和技术的发展,为机器人、无人车等技术的推进和发展提供有力的保障。

结项摘要

本项目深入研究了基于结构化深度学习的图像场景理解问题。围绕场景语义描述、语义分割、深度估计等计算机视觉关键科学问题展开系统研究,提出了新颖的方法,取得了一定的成果,包括:面向场景分析的自适应上下文神经网络模型、基于反事实多智能体强化学习的非自回归场景语义描述模型、基于多视图特征与混合奖励的场景语义描述方法、基于双重关系感知注意网络的场景解析方法、基于连续条件随机场的单目图像场景深度估计神经网络等。项目组共发表论文11篇,其中发表期刊论文4篇,发表高水平国际会议论文7篇。本项目的研究将促进基于视觉的场景理解理论和技术的发展,为机器人、无人车等技术的推进和发展提供有力的保障。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(2)
Skeleton-Based Action Recognition With Multi-Stream Adaptive Graph Convolutional Networks
具有多流自适应图卷积网络的基于骨架的动作识别
  • DOI:
    10.1109/tip.2020.3028207
  • 发表时间:
    2020-01-01
  • 期刊:
    IEEE TRANSACTIONS ON IMAGE PROCESSING
  • 影响因子:
    10.6
  • 作者:
    Shi, Lei;Zhang, Yifan;Lu, Hanqing
  • 通讯作者:
    Lu, Hanqing

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于结构化深度学习的单目图像深度估计
  • DOI:
    10.13973/j.cnki.robot.2017.0812
  • 发表时间:
    2017
  • 期刊:
    机器人
  • 影响因子:
    --
  • 作者:
    李耀宇;王宏民;张一帆;卢汉清
  • 通讯作者:
    卢汉清
A Graph-based Image Annotation Framework
基于图的图像标注框架
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Pattern Recognition Letters
  • 影响因子:
    5.1
  • 作者:
    刘静;王斌;卢汉清;马颂德
  • 通讯作者:
    马颂德
Scale multiplication in odd Ga
奇数 Ga 中的尺度乘法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
  • 影响因子:
    --
  • 作者:
    朱振峰*;卢汉清;赵耀
  • 通讯作者:
    赵耀
结合半监督核的高斯过程分类
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    李宏伟;刘扬;卢汉清;方亦凯
  • 通讯作者:
    方亦凯
基于特征融合的指纹质量评估算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    华南理工大学学报,Vol.35, No.5, pp20-24, May 2007
  • 影响因子:
    --
  • 作者:
    马丽红(*);余德聪;卢汉清;陈
  • 通讯作者:

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

卢汉清的其他基金

受限环境的跨模态目标识别与行为理解
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    253 万元
  • 项目类别:
    联合基金项目
受限环境的跨模态目标识别与行为理解
  • 批准号:
    U21B2043
  • 批准年份:
    2021
  • 资助金额:
    253.00 万元
  • 项目类别:
    联合基金项目
基于上下文隐式概念模型的图像与视频分类研究
  • 批准号:
    61070104
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
面向无线网络环境的个性化视频定制及适配关键技术
  • 批准号:
    60833006
  • 批准年份:
    2008
  • 资助金额:
    190.0 万元
  • 项目类别:
    重点项目
基于事件的体育视频分析
  • 批准号:
    60475010
  • 批准年份:
    2004
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码