图像可编辑性研究
结题报告
批准号:
61702488
项目类别:
青年科学基金项目
资助金额:
27.0 万元
负责人:
吴富章
学科分类:
F0209.计算机图形学与虚拟现实
结题年份:
2020
批准年份:
2017
项目状态:
已结题
项目参与者:
孔彦、郭建伟、张珩、张潇、张鸿骏、刘畅、张勇、唐帆、盛柯恺
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
图像编辑是一项对图像的内容、风格、尺寸等可视因素进行制作和调整的技术,在平面设计、影视制作等领域有着广泛的应用。本项目力求对图像的可编辑性属性进行研究,基于互联网中海量的图像可视数据,利用深度神经网络提取多模态特征对图像在尺寸、色调风格以及内容等方面的可编辑性进行建模研究。项目拟解决的关键科学问题包括:数据驱动的图像可缩放属性的建模与预测,基于混合特征的图像可合成属性学习,基于多任务深度学习的图像可调色性模型构建。项目的创新性在于以数据驱动为主要核心机制对图像的编辑属性进行研究,同时从多种角度构造图像的特征表达,充分结合视觉认识机理和美学原理,致使图像编辑方法所生成的结果更加符合人类的审美和视觉倾向。
英文摘要
Image editing is a technology of making and adjusting visual elements in an image such as content, style, size and so on. It's popular and widely used in many fields, such as in graphic design and film productions. In this project, we aim to study the image editing properties with the help of massive visual media data from the Internet. More specifically, we plan to exact the multi-modal features from the internet images, and try to model the potential relationships between the extracted features and image editing properties. To implement this goal, deep neural networks are expected to be used in this project. The whole project includes three key scientific issues: data-driven based image retargetability modeling and prediction, hybrid-feature based image synthesizability learning and multi-task based image color adjustability modeling. The innovativeness exist in data-driven based image editing properties learning, multi-modal based image feature representation with combination of visual cognition mechanism and aesthetic principle. With above innovations, the project is expected to propose a series of image editing methods which can generate more satisfactory results in esthetics and visual tendency.
图像编辑是一项对图像的内容、风格、尺寸等可视因素进行制作和调整的技术,是多媒体信息处理和和计算机视觉领域的热点问题,在以数字内容和数字技术为基础的照片编辑、影视制作和平面设计等文化产业领域有着很重要的应用。本项目对基于海量可视媒体数据的图像可编辑性建模方法进行了深入研究,重点探索了如何建立语义特征表达和图像编辑属性之间的关联关系,从而提高图像的编辑质量。在执行过程中,本项目主要对图像的三类编辑属性进行了研究:可缩放属性、可调色属性、可合成属性。在图像的可缩放属性方面,我们主要对数据驱动的图像可缩放属性建模方法进行了研究;在图像的可调色属性方面,我们主要对图像美学评估、艺术图像聚类等问题进行了研究;在图像的可合成属性方面,我们主要对人脸图像修复、平面图像分析、可视媒体特征学习等问题进行了研究。本项目在执行过程中共发表国际期刊论文4篇、国际会议论文9篇、国内核心期刊论文1篇,申请中国发明专利5项,均已获得授权。本项目的创新性在于以数据驱动为主要核心机制对图像的编辑属性进行了研究,由于结合了图像的美学先验知识和语义信息,因此算法对图像的可编辑属性预测更符合人类的审美观念和视觉倾向,进而对图像编辑操作能够给予更有价值的参考。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Learning local shape descriptors for computing non-rigid dense correspondence
学习局部形状描述符以计算非刚性密集对应
DOI:10.1007/s41095-020-0163-y
发表时间:2020
期刊:Computational Visual Media
影响因子:6.9
作者:Jianwei Guo;Hanyu Wang;Zhanglin Cheng;Xiaopeng Zhang;Dong-Ming Yan
通讯作者:Dong-Ming Yan
DOI:--
发表时间:2020
期刊:中国体视学与图像分析
影响因子:--
作者:张蔚;王腾;卢政达;杨思宇;孟维亮;郭建伟;张晓鹏
通讯作者:张晓鹏
Image Retargetability
图像可重定向性
DOI:10.1109/tmm.2019.2932620
发表时间:2018-02
期刊:IEEE Transactions on Multimedia
影响因子:7.3
作者:Tang Fan;Dong Weiming;Meng Yiping;Ma Chongyang;Wu Fuzhang;Li Xinrui;Lee Tong-Yee
通讯作者:Lee Tong-Yee
DOI:10.1007/s11042-019-7271-7
发表时间:2019
期刊:Multimedia Tools and Applications
影响因子:3.6
作者:Deng Yingying;Tang Fan;Dong Weiming;Wu Fuzhang;Deussen Oliver;Xu Changsheng
通讯作者:Xu Changsheng
Gradient-aware blind face inpainting for deep face verification
用于深度面部验证的梯度感知盲人面部修复
DOI:10.1016/j.neucom.2018.11.073
发表时间:2019-02
期刊:Neurocomputing
影响因子:6
作者:Wu Fuzhang;Kong Yan;Dong Weiming;Wu Yanjun
通讯作者:Wu Yanjun
国内基金
海外基金