RI: Medium: Learning to Map and Navigate with Vision and Language
RI:媒介:学习用视觉和语言绘制地图和导航
基本信息
- 批准号:2212433
- 负责人:
- 金额:$ 120万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-01 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project aims to advance the state of the art in robotic mapping and navigation by enabling spatial understanding using semantic maps and spatial reasoning for following language instructions given only visual inputs. Current performance in those tasks is low because of the inability to ground semantic entities and instructions spatially. Instead of grounding semantics to images, spatial understanding and navigation can be achieved if a system uses maps as an intermediate representation, as also indicated by behavioral and neural findings in spatial cognition. Building a map of an unseen space without exhaustive exploration can be learned, and this process can be facilitated by cross-modal language-vision attentional mechanisms. The project will integrate research with education and outreach underrepresented groups in Philadelphia neighborhoods as a target broadening the participation.This research is centered around understanding how vision and language interact to create better spatial representations like maps and facilitate navigation. The project will approach the vision-language from three angles. (i) How robots can learn to predict a map when entering an unseen environment using active learning. (ii) How navigation instructions can be encoded into spatial configuration schemata and navigational concepts that can be better aligned to maps and paths than raw language embeddings, and (iii) how navigational language representations can facilitate the creation of maps in unseen environments, and how one can follow instructions by using maps and language to create paths to follow.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在通过使用语义地图和空间推理来实现空间理解,从而在仅给定视觉输入的语言指令中推进机器人地图和导航的最新技术。目前在这些任务中的表现很低,因为无法在空间上建立语义实体和指令。如果系统使用地图作为中间表示,就可以实现空间理解和导航,而不是基于图像的语义,正如空间认知中的行为和神经发现所表明的那样。在没有详尽探索的情况下构建一个未知空间的地图是可以学习的,这一过程可以通过跨模态语言-视觉注意机制来促进。该项目将把研究与教育结合起来,并将费城社区中未被充分代表的群体作为扩大参与的目标。这项研究的核心是理解视觉和语言如何相互作用,以创造更好的空间表征,如地图和方便导航。该项目将从三个角度探讨视觉语言。(i)机器人如何通过主动学习在进入未知环境时学习预测地图。(ii)如何将导航指令编码为空间配置模式和导航概念,从而比原始语言嵌入更能与地图和路径对齐;(iii)导航语言表示如何促进在未知环境中创建地图,以及如何通过使用地图和语言创建路径来遵循指令。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-modal Map Learning for Vision and Language Navigation
- DOI:10.1109/cvpr52688.2022.01502
- 发表时间:2022-03
- 期刊:
- 影响因子:0
- 作者:G. Georgakis;Karl Schmeckpeper;Karan Wanchoo;Soham Dan;E. Miltsakaki;D. Roth;Kostas Daniilidis
- 通讯作者:G. Georgakis;Karl Schmeckpeper;Karan Wanchoo;Soham Dan;E. Miltsakaki;D. Roth;Kostas Daniilidis
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kostas Daniilidis其他文献
Template gradient matching in spherical images
球形图像中的模板梯度匹配
- DOI:
10.1117/12.527043 - 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
L. Sorgi;Kostas Daniilidis - 通讯作者:
Kostas Daniilidis
Technical report on Optimization-Based Bearing-Only Visual Homing with Applications to a 2-D Unicycle Model
关于基于优化的仅轴承视觉归位及其在二维独轮车模型中的应用的技术报告
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Roberto Tron;Kostas Daniilidis - 通讯作者:
Kostas Daniilidis
Perception-Driven Curiosity with Bayesian Surprise
感知驱动的好奇心与贝叶斯惊喜
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Bernadette Bucher;Anton Arapin;Ramanan Sekar;M. Badger;Feifei Duan;Oleh Rybkin;Kostas Daniilidis - 通讯作者:
Kostas Daniilidis
Live Demonstration: Unsupervised Event-Based Learning of Optical Flow, Depth and Egomotion
现场演示:基于事件的无监督光流、深度和自我运动学习
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
A. Z. Zhu;Liangzhe Yuan;Kenneth Chaney;Kostas Daniilidis - 通讯作者:
Kostas Daniilidis
EV-Catcher: High-Speed Object Catching Using Low-Latency Event-Based Neural Networks
EV-Catcher:使用低延迟基于事件的神经网络进行高速对象捕获
- DOI:
10.1109/lra.2022.3188400 - 发表时间:
2022 - 期刊:
- 影响因子:5.2
- 作者:
ZiYun Wang;F. Ojeda;Anthony Bisulco;Daewon Lee;C. J. Taylor;Kostas Daniilidis;M. A. Hsieh;Daniel D. Lee;Volkan Isler - 通讯作者:
Volkan Isler
Kostas Daniilidis的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kostas Daniilidis', 18)}}的其他基金
Collaborative Research: Visual Tactile Neural Fields for Active Digital Twin Generation
合作研究:用于主动数字孪生生成的视觉触觉神经场
- 批准号:
2220868 - 财政年份:2022
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
RI: Medium: Collaborative Research: Closed Loop Perceptual Planning for Dynamic Locomotion
RI:中:协作研究:动态运动的闭环感知规划
- 批准号:
1703319 - 财政年份:2017
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
MRI: Development of an Observatory for Quantitative Analysis of Collective Behavior in Animals
MRI:开发动物集体行为定量分析观测站
- 批准号:
1626008 - 财政年份:2016
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
I/UCRC Phase I: Robots and Sensors for the Human Well-being
I/UCRC 第一阶段:造福人类福祉的机器人和传感器
- 批准号:
1439681 - 财政年份:2014
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
NRI: Small: Collaborative Research: Active Sensing for Robotic Cameramen
NRI:小型:协作研究:机器人摄影师的主动传感
- 批准号:
1317947 - 财政年份:2013
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
I-Corps: BlindNav: Indoor Navigation for the Visually Impaired
I-Corps:BlindNav:为视障人士提供室内导航
- 批准号:
1265129 - 财政年份:2012
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
CDI-Type II: Collaborative Research: Perception of Scene Layout by Machines and Visually Impaired Users
CDI-Type II:协作研究:机器和视障用户对场景布局的感知
- 批准号:
1028009 - 财政年份:2010
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
CDI-Type II: Collaborative Research: Cyber Enhancement of Spatial Cognition for the Visually Impaired
CDI-Type II:协作研究:视觉障碍者空间认知的网络增强
- 批准号:
0835714 - 财政年份:2008
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
RI: Collaborative Research: Bio-inspired Navigation
RI:合作研究:仿生导航
- 批准号:
0713260 - 财政年份:2007
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
相似海外基金
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313151 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313149 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
Collaborative Research: RI: Medium: Superhuman Imitation Learning from Heterogeneous Demonstrations
合作研究:RI:媒介:异质演示中的超人模仿学习
- 批准号:
2312955 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313150 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Continuing Grant
RI: Medium: Foundations of Recourse Verification in Machine Learning
RI:媒介:机器学习资源验证的基础
- 批准号:
2313105 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Superhuman Imitation Learning from Heterogeneous Demonstrations
合作研究:RI:媒介:异质演示中的超人模仿学习
- 批准号:
2312956 - 财政年份:2023
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
RI: Medium: Foundations of Self-Supervised Learning Through the Lens of Probabilistic Generative Models
RI:媒介:通过概率生成模型的视角进行自我监督学习的基础
- 批准号:
2211907 - 财政年份:2022
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Bootstrapping natural feedback for reinforcement learning
合作研究:RI:中:引导强化学习的自然反馈
- 批准号:
2212310 - 财政年份:2022
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: MoDL: Occams Razor in Deep and Physical Learning
合作研究:RI:媒介:MoDL:深度学习和物理学习中的奥卡姆斯剃刀
- 批准号:
2212519 - 财政年份:2022
- 资助金额:
$ 120万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Learning Compositional Implicit Representations for 3D Scene Understanding
合作研究:RI:媒介:学习 3D 场景理解的组合隐式表示
- 批准号:
2211258 - 财政年份:2022
- 资助金额:
$ 120万 - 项目类别:
Standard Grant














{{item.name}}会员




