基于图像语义理解的场景三维恢复

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872023
  • 项目类别:
    面上项目
  • 资助金额:
    66.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0209.计算机图形学与虚拟现实
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

The technology of three-dimensional scene recovery is one of the hot topics in the field of computer vision, using the visual image to calculate the three-dimensional model of real scene. Existing technologies of three-dimensional scene recovery generally utilize image color features and scene geometry constraints, which only adopt the limited underlying semantic. Therefore, it is difficult to recover the real scene with insufficient image texture. This project intends to fully explore how to introduce image semantic understanding into the real scene recovery. We attempt to design a novel deep learning network for image semantic segmentation to analyze the semantic information. On this basis, we aim to explore three-dimensional recovery technologies of single image, multiple images and video sequence. This project is proposed to study the automatic three-dimensional recovery of single image based on semantic understanding. Moreover, this project aims to research semantic-based image matching, and to obtain the three-dimensional recovery of multiple low-overlap images using chain registration. In addition, combining with the image semantic understanding, this project aims to explore a robust SLAM method to realize the three-dimensional dense scene reconstruction. This project explores three-dimensional recovery technology based on image semantic understanding, which would provide new ideas and foundation to improve the efficiency and robustness of scene reconstruction. With breakthroughs in deep learning methods, this project aims to promote the development of related technologies.
场景三维恢复技术利用视觉图像计算求取现实景物的三维模型表达,是计算机视觉领域的研究热点之一。现有的场景三维恢复技术往往通过图像颜色特征以及场景几何结构约束进行处理,仅利用了有限的图像底层语义,对图像纹理特征不足的场景,难以恢复理想的三维场景。本项目拟较为全面地探索将图像语义理解引入到真实场景的三维结构恢复中,设计图像语义分割深度学习网络,解析图像语义信息,在此基础上研究单幅图像、多幅图像以及视频图像序列的三维恢复技术。拟研究基于语义理解的单幅图像三维几何结构自动恢复;研究基于语义的图像匹配技术,采用多幅图像间的链式注册实现多幅低重叠度图像的三维恢复;结合图像语义理解,研究更鲁棒的同时定位与地图构建方法,实现场景的稠密三维重建。本项目探索基于图像语义理解的场景三维恢复,为提高场景重建的效率与鲁棒性提供了新的思路和基础,在深度学习方法取得突破的背景下,力争促进相关技术发展。

结项摘要

传统的场景三维恢复技术多数是基于颜色与几何特征的场景三维恢复方法,通常只能利用有限的图像底层语义,对图像语义理解技术的挖掘较少,在图像纹理特征提取困难的情况下存在问题,并且导致生成的模型缺乏语义理解。因此,本项目将图像语义理解引入到真实场景的三维恢复中,基于深度学习设计图像语义分割网络,解析图像语义信息,实现多幅图像的三维恢复,与SLAM算法相结合,可实时恢复视频图像序列的场景三维稠密地图。.在项目研究中,针对多幅图像或者视频图像序列展开研究,充分利用场景的低层级特征和高层级特征获得初步的语义分割结果;引入残差网络,进一步优化图像语义分割结果;结合夜晚图像的特点和白天图像场景语义信息,实现场景的三维结构自动恢复;结合图像语义分割和布局结构关键点检测方法,实现基于关键点检测的单幅图像三维结构推断方法;利用鱼眼相机大视场优势,解析其中的几何语义信息,实现室内鱼眼图像的三维场景恢复;采用多幅图像匹配技术,将多个小视场场景进行组合,实现大视场场景的三维结构恢复;对图像场景中的语义信息进行研究,补偿多幅图像叠加变换所产生的累积误差;利用多幅图像重叠区域的特征点信息,提高多幅图像匹配的精确性与鲁棒性;利用人工场景图像的重叠区域特征线信息,实现基于多幅图像匹配的链式三维结构恢复;基于场景几何语义信息,获得更为准确的三维场景稠密深度地图;联合图像语义信息高维特征,提高SLAM算法中相机跟踪、姿态估计、闭环检测等部分的准确率,实现对真实场景更鲁棒的三维恢复。.通过本项目研究,形成了语义分割、单幅图像结构恢复、多幅图像链式结构恢复及视频图像序列的三维恢复等关键技术突破,在本领域重要期刊和会议上发表相关论文14篇,其中IEEE汇刊论文3篇(含1篇ESI高被引论文)、其它SCI检索期刊论文9篇、领域专业EI检索期刊论文1篇;CCF推荐的国际会议论文4篇,其中A类会议论文1篇、B类会议论文1篇、C类会议论文2篇。相关成果还申请了发明专利10项,其中国际专利1项已授权。依托项目培养博士后1人,博士毕业生4人、硕士毕业生7人。支持项目组研究骨干参加国内外学术交流和开展国际合作交流20余人次,提高了项目关键技术的研究水平。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(4)
专利数量(10)
RCAG-Net: Residual Channelwise Attention Gate Network for Hot Spot Defect Detection of Photovoltaic Farms
RCAG-Net:用于光伏发电场热点缺陷检测的残余通道注意门网络
  • DOI:
    10.1109/tim.2021.3054415
  • 发表时间:
    2021
  • 期刊:
    IEEE Transactions on Instrumentation and Measurement
  • 影响因子:
    5.6
  • 作者:
    Su Binyi;Chen Haiyong;Liu Kun;Liu Weipeng
  • 通讯作者:
    Liu Weipeng
Low Dimensional Discriminative Representation of Fully Connected Layer Features Using Extended LargeVis Method for High-Resolution Remote Sensing
使用扩展的 LargeVis 方法进行高分辨率遥感全连接层特征的低维判别表示
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    Sensors
  • 影响因子:
    3.9
  • 作者:
    Zheng Zhuo;Zhong Zhou
  • 通讯作者:
    Zhong Zhou
Deep Semantic Feature Matching Using Confidential Correspondence Consistency
使用机密对应一致性的深度语义特征匹配
  • DOI:
    10.1109/access.2020.2966655
  • 发表时间:
    2020
  • 期刊:
    IEEE Access
  • 影响因子:
    3.9
  • 作者:
    Wei Lyu;Lang Chen;Zhong Zhou;Wei Wu
  • 通讯作者:
    Wei Wu
BAF-Detector: An Efficient CNN-Based Detector for Photovoltaic Cell Defect Detection
BAF-Detector:一种基于 CNN 的高效光伏电池缺陷检测器
  • DOI:
    10.1109/tie.2021.3070507
  • 发表时间:
    2022-03-01
  • 期刊:
    IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS
  • 影响因子:
    7.7
  • 作者:
    Su, Binyi;Chen, Haiyong;Zhou, Zhong
  • 通讯作者:
    Zhou, Zhong
Remote Sensing Image Retrieval with Gabor-CA-ResNet and Split-Based Deep Feature Transform Network
使用 Gabor-CA-ResNet 和基于分割的深度特征变换网络进行遥感图像检索
  • DOI:
    10.3390/rs13050869
  • 发表时间:
    2021-02
  • 期刊:
    REMOTE SENSING
  • 影响因子:
    5
  • 作者:
    Zhuo Zheng;Zhou Zhong
  • 通讯作者:
    Zhou Zhong

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

用飞行时间相机优化可视外壳的实时三维重建算法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    王聪;周忠;吴威
  • 通讯作者:
    吴威
宽频范围同类型双层电磁屏蔽织物 的屏蔽效能变化规律
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    现代纺织技术(科技核心)
  • 影响因子:
    --
  • 作者:
    汪秀琛;李亚云;段佳佳;刘哲;周忠
  • 通讯作者:
    周忠
可视化方法在常微分方程数值解教学中的应用
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    教育现代化
  • 影响因子:
    --
  • 作者:
    周忠;周瑞芳
  • 通讯作者:
    周瑞芳
虚实融合监控场景中的漫游路径规划方法
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    周颐;解佳琦;吴威;周忠
  • 通讯作者:
    周忠
基于片段关键帧的视频行为识别方法
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    系统仿真学报
  • 影响因子:
    --
  • 作者:
    李鸣晓;庚琦川;莫红;吴威;周忠
  • 通讯作者:
    周忠

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

周忠的其他基金

虚实融合与视觉理解结合的多相机场景感知与预测
  • 批准号:
    62272018
  • 批准年份:
    2022
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
面向跨相机跟踪的场景几何-语义联合理解与关联
  • 批准号:
    61572061
  • 批准年份:
    2015
  • 资助金额:
    67.0 万元
  • 项目类别:
    面上项目
非刚性变形的实时远程再现
  • 批准号:
    61170188
  • 批准年份:
    2011
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
多用户远程沉浸中的实时三维重建与相关性传输
  • 批准号:
    61073070
  • 批准年份:
    2010
  • 资助金额:
    11.0 万元
  • 项目类别:
    面上项目
大规模分布交互仿真中的可靠组播服务模型及算法研究
  • 批准号:
    60603084
  • 批准年份:
    2006
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码