Structural analysis and interactive composition of visual media
视觉媒体的结构分析和交互构成
基本信息
- 批准号:EP/J009830/1
- 负责人:
- 金额:$ 12.21万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2012
- 资助国家:英国
- 起止时间:2012 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project represents joint work between 12 leading Chinese Universities, and several other invited key partners in the UK and US. The Internet, and other large-scale databases, form a significant resource of what may be termed "visual media": images, videos, 3D shape models, and so on. Internet text searches usually produce useful results. However, it can be much more difficult to find visual media, e.g. videos with specific content, or images similar to a picture in one's mind's eye. This is partly due to the fact that most image search is based on text inputs, and partly due to the difficulty of classifying pictures. It is easy for humans to "know" what an image contains, but image understanding by computer requires many tricky tasks - splitting an image into separate objects, and analysing their colour, their shape, and many other attributes. Better solutions to search of visual media would enable many applications in addition to search itself, and we will also look at one of them - the re-use of existing visual media when creating new visual media. This project has four main goals. The first is to investigate new approaches to structural analysis of visual media. This will include devising methods to find salient information (for example, what is the main object? what is irrelevant background? how is this object composed of parts?), and methods which process the information on different scales (small details may be just as important as overall shape, for example). The aim is to come up with hierarchical descriptions of the important information in visual media. The second is to find efficient new approaches to comparing, classifying and searching visual media, based on the above hierarchical descriptions. We will also look at how sketches can be used as a much more powerful means than text of allowing users to describe what they want to find when searching.The third area to be considered is editing and resynthesis of visual media. Structural analysis will provide more meaningful ways to select parts of an image than just, for example, all parts of the scene with a certain colour. In turn, this will simplify the process of editing visual media. Users will be able to apply consistent editing to scene elements with similar meaning (e.g. the user controls bending of one finger, and the computer applies a similar bend to the rest of the fingers of a hand, despite minor shape differences). More powerful search will also allow elements to be rapidly retrieved from visual media databases or the Internet to be combined into new scenes, or to be included within existing images, with suitable adjustment for different lighting, etc. When video is processed, further considerations will be needed to ensure results are consistent over time, and smoothly vary as time progresses; the vast amounts of data involved in video processing make this a challenging problem.The final area of work concerns the use of machine learning techniques to assist with all of the previous goals. The aim here is to automatically learn to recognize complex patterns, permitting software to make intelligent decisions based on visual data. Ultimately, a careful balance must be struck in which the user is firmly in control of the creative process, but the computer makes it easy for the user to produce the desired results.
该项目代表了中国12所领先大学与英国和美国其他几个受邀重要合作伙伴的联合工作。互联网和其他大规模的数据库,形成了一个重要的资源,可以被称为“视觉媒体”:图像,视频,3D形状模型,等等。互联网文本搜索通常会产生有用的结果。然而,要找到视觉媒体可能要困难得多,例如具有特定内容的视频,或者类似于一个人脑海中的图片的图像。这部分是由于大多数图像搜索是基于文本输入的事实,部分是由于分类图片的困难。人类很容易“知道”图像包含什么,但计算机理解图像需要许多棘手的任务-将图像分割为单独的对象,并分析它们的颜色,形状和许多其他属性。更好的视觉媒体搜索解决方案将使许多应用程序除了搜索本身,我们也将看看其中之一-重用现有的视觉媒体时,创造新的视觉媒体。该项目有四个主要目标。第一是研究视觉媒体结构分析的新方法。这将包括设计方法来发现显著信息(例如,主要对象是什么?什么是不相关的背景?这个对象是如何由部件组成的?),以及在不同尺度上处理信息的方法(例如,小细节可能与整体形状一样重要)。其目的是提出视觉媒体中重要信息的层次描述。第二是在上述层次描述的基础上,寻找有效的新方法来比较、分类和搜索视觉媒体。我们还将研究草图如何作为一种比文本更强大的手段,允许用户在搜索时描述他们想要找到的内容。第三个要考虑的领域是视觉媒体的编辑和再合成。结构分析将提供更有意义的方法来选择图像的部分,而不仅仅是,例如,具有某种颜色的场景的所有部分。反过来,这将简化编辑视觉媒体的过程。用户将能够对具有类似含义的场景元素应用一致的编辑(例如,用户控制一个手指的弯曲,并且计算机对手的其余手指应用类似的弯曲,尽管有微小的形状差异)。更强大的搜索功能还将允许从视觉媒体数据库或互联网中快速检索元素,以组合成新的场景,或包含在现有图像中,并针对不同的照明进行适当调整等。视频处理中涉及的大量数据使这成为一个具有挑战性的问题。2最后一个工作领域涉及使用机器学习技术来帮助实现所有先前的目标。这里的目标是自动学习识别复杂的模式,允许软件根据视觉数据做出智能决策。最终,必须达到一种谨慎的平衡,即用户牢牢控制创作过程,但计算机使用户更容易产生所需的结果。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Automatic Semantic Modeling of Indoor Scenes from Low-quality RGB-D Data using Contextual Information
- DOI:10.1145/2661229.2661239
- 发表时间:2014-11-01
- 期刊:
- 影响因子:6.2
- 作者:Chen, Kang;Lai, Yu-Kun;Hu, Shi-Min
- 通讯作者:Hu, Shi-Min
Structure Aware Visual Cryptography
- DOI:10.1111/cgf.12482
- 发表时间:2014-10
- 期刊:
- 影响因子:2.5
- 作者:Bin Liu-;Ralph Robert Martin;Jianjun Huang;Shimin Hu
- 通讯作者:Bin Liu-;Ralph Robert Martin;Jianjun Huang;Shimin Hu
Internet visual media processing: a survey with graphics and vision applications
互联网视觉媒体处理:图形和视觉应用调查
- DOI:10.1007/s00371-013-0792-6
- 发表时间:2013-03
- 期刊:
- 影响因子:3.5
- 作者:Hu, Shi-Min;Chen, Tao;Xu, Kun;Cheng, Ming-Ming;Martin, Ralph R.
- 通讯作者:Martin, Ralph R.
Learning Natural Colors for Image Recoloring
学习自然色彩以进行图像重新着色
- DOI:10.1111/cgf.12498
- 发表时间:2014-10
- 期刊:
- 影响因子:2.5
- 作者:Huang H. -Z.;Zhang S. -H.;Martin R. R.;Hu S. -M.
- 通讯作者:Hu S. -M.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ralph Martin其他文献
Just Initiation of Securitization: Just Referent Objects
证券化的刚刚启动:只是指涉对象
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
H. Feijen;Ralph Martin;C. Feijen - 通讯作者:
C. Feijen
A New Pentecost?: Catholic Theology and “Baptism in the Spirit”
新的五旬节?:天主教神学和“圣灵的洗礼”
- DOI:
10.1353/log.2011.0019 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Ralph Martin - 通讯作者:
Ralph Martin
2007、pp82-89、(18)黒田日出男、戦国の使者と『甲陽軍鑑』-『甲陽軍鑑』の史料論(5)-
2007, pp82-89, (18) 战国使者黑田英夫与《红阳军舰》 - 《红阳军舰》的史料理论 (5) -
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Ralph Martin;Peter Varley;Hiromasa Suzuki;黒田日出男 - 通讯作者:
黒田日出男
Labelling Engineering Line Drawings Using Depth Reasoning
使用深度推理标记工程线图
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Ralph Martin;Peter Varley;Hiromasa Suzuki - 通讯作者:
Hiromasa Suzuki
On the relative importance of ecology and geographic isolation as drivers for differentiation of call types of red crossbill
Loxia curvirostra
in the Palearctic
生态和地理隔离作为古北界红交嘴鸟 Loxia curvirostra 叫声类型分化驱动因素的相对重要性
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Ralph Martin;Julien Rochefort;R. Mundry;G. Segelbacher - 通讯作者:
G. Segelbacher
Ralph Martin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ralph Martin', 18)}}的其他基金
SEOCEMS Noyce Scholarship Program: Phase I
SEOCEMS 诺伊斯奖学金计划:第一阶段
- 批准号:
0833295 - 财政年份:2008
- 资助金额:
$ 12.21万 - 项目类别:
Standard Grant
Intelligent Processing of Visual Media
视觉媒体智能处理
- 批准号:
EP/E034357/1 - 财政年份:2007
- 资助金额:
$ 12.21万 - 项目类别:
Research Grant
Lead Teacher Project: K-6 Mathematics and Science Teacher Enhancement
首席教师项目:K-6 数学和科学教师提升
- 批准号:
8955185 - 财政年份:1990
- 资助金额:
$ 12.21万 - 项目类别:
Continuing grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Intelligent Patent Analysis for Optimized Technology Stack Selection:Blockchain BusinessRegistry Case Demonstration
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
利用全基因组关联分析和QTL-seq发掘花生白绢病抗性分子标记
- 批准号:31971981
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
基于SERS纳米标签和光子晶体的单细胞Western Blot定量分析技术研究
- 批准号:31900571
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
利用多个实验群体解析猪保幼带形成及其自然消褪的遗传机制
- 批准号:31972542
- 批准年份:2019
- 资助金额:57.0 万元
- 项目类别:面上项目
基于Meta-analysis的新疆棉花灌水增产模型研究
- 批准号:41601604
- 批准年份:2016
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究
- 批准号:61502059
- 批准年份:2015
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
多目标诉求下我国交通节能减排市场导向的政策组合选择研究
- 批准号:71473155
- 批准年份:2014
- 资助金额:60.0 万元
- 项目类别:面上项目
大规模微阵列数据组的meta-analysis方法研究
- 批准号:31100958
- 批准年份:2011
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于物质流分析的中国石油资源流动过程及碳效应研究
- 批准号:41101116
- 批准年份:2011
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
相似海外基金
A Dynamic Analysis of Advertising Interactive Techniques to Gain the Consumer Engagement
获得消费者参与的广告互动技术的动态分析
- 批准号:
23K01642 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CareNet, An Interactive Digital Tool to Assess Informal Caregiving Networks of Older Adults with Dementia
CareNet,一种交互式数字工具,用于评估患有痴呆症的老年人的非正式护理网络
- 批准号:
10893774 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
Interactive Effects of Prenatal Bisphenol Exposure and Postnatal Maternal Care on DNA Methylation in the Developing Brain
产前双酚暴露和产后母亲护理对发育中大脑 DNA 甲基化的相互作用
- 批准号:
10678118 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
CRII:SCH: Interactive Explainable Deep Survival Analysis
CRII:SCH:交互式可解释深度生存分析
- 批准号:
2245739 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
Standard Grant
A Cognitive Pragmatic Analysis of Narrative Markers: A Pluralistic and Interactive Approach
叙事标记的认知语用分析:多元互动方法
- 批准号:
23K00522 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Using an Interactive Website to Disseminate Normal Overnight and Daytime Polysomnography Parameters
使用交互式网站传播正常的夜间和白天多导睡眠图参数
- 批准号:
487895 - 财政年份:2023
- 资助金额:
$ 12.21万 - 项目类别:
Miscellaneous Programs
Integrative and interactive analyses of host transcriptional response to COVID-19 and other respiratory viral infections
宿主对 COVID-19 和其他呼吸道病毒感染的转录反应的综合和交互式分析
- 批准号:
10372463 - 财政年份:2022
- 资助金额:
$ 12.21万 - 项目类别:
Integrative and interactive analyses of host transcriptional response to COVID-19 and other respiratory viral infections
宿主对 COVID-19 和其他呼吸道病毒感染的转录反应的综合和交互式分析
- 批准号:
10618134 - 财政年份:2022
- 资助金额:
$ 12.21万 - 项目类别:
Effectiveness of an mHealth Interactive Education and Social Support Intervention for Improving Postnatal Health
移动医疗互动教育和社会支持干预措施对改善产后健康的有效性
- 批准号:
10671088 - 财政年份:2022
- 资助金额:
$ 12.21万 - 项目类别: