RI: Medium: Learning to Map and Navigate with Vision and Language

RI:媒介:学习用视觉和语言绘制地图和导航

基本信息

  • 批准号:
    2212433
  • 负责人:
  • 金额:
    $ 120万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

This project aims to advance the state of the art in robotic mapping and navigation by enabling spatial understanding using semantic maps and spatial reasoning for following language instructions given only visual inputs. Current performance in those tasks is low because of the inability to ground semantic entities and instructions spatially. Instead of grounding semantics to images, spatial understanding and navigation can be achieved if a system uses maps as an intermediate representation, as also indicated by behavioral and neural findings in spatial cognition. Building a map of an unseen space without exhaustive exploration can be learned, and this process can be facilitated by cross-modal language-vision attentional mechanisms. The project will integrate research with education and outreach underrepresented groups in Philadelphia neighborhoods as a target broadening the participation.This research is centered around understanding how vision and language interact to create better spatial representations like maps and facilitate navigation. The project will approach the vision-language from three angles. (i) How robots can learn to predict a map when entering an unseen environment using active learning. (ii) How navigation instructions can be encoded into spatial configuration schemata and navigational concepts that can be better aligned to maps and paths than raw language embeddings, and (iii) how navigational language representations can facilitate the creation of maps in unseen environments, and how one can follow instructions by using maps and language to create paths to follow.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在通过使用语义地图和空间推理来实现空间理解,以遵循仅给予视觉输入的语言指令,从而推进机器人测绘和导航的最新技术水平。这些任务的当前性能很低,因为无法在空间上将语义实体和指令接地。如果一个系统使用地图作为中间表示,而不是将语义与图像联系起来,就可以实现空间理解和导航,空间认知中的行为和神经发现也表明了这一点。构建一个看不见的空间的地图,而不需要穷尽的探索是可以学习的,这个过程可以通过跨模态的语言-视觉注意机制来促进。该项目将把研究与教育和外展费城社区的代表性不足的群体作为扩大参与的目标。这项研究的重点是了解视觉和语言如何相互作用,以创建更好的空间表示,如地图和方便导航。该项目将从三个角度探讨视觉语言。(i)机器人如何使用主动学习在进入看不见的环境时学习预测地图。(ii)导航指令如何被编码到空间配置模式和导航概念中,这些概念可以比原始语言嵌入更好地与地图和路径对齐,以及(iii)导航语言表示如何促进在看不见的环境中创建地图,以及如何通过使用地图和语言来创建路径来遵循指示。该奖项反映了NSF的法定使命,并被认为是值得的。通过使用基金会的知识价值和更广泛的影响审查标准进行评估来提供支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-modal Map Learning for Vision and Language Navigation
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kostas Daniilidis其他文献

Perception-Driven Curiosity with Bayesian Surprise
感知驱动的好奇心与贝叶斯惊喜
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bernadette Bucher;Anton Arapin;Ramanan Sekar;M. Badger;Feifei Duan;Oleh Rybkin;Kostas Daniilidis
  • 通讯作者:
    Kostas Daniilidis
Technical report on Optimization-Based Bearing-Only Visual Homing with Applications to a 2-D Unicycle Model
关于基于优化的仅轴承视觉归位及其在二维独轮车模型中的应用的技术报告
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Roberto Tron;Kostas Daniilidis
  • 通讯作者:
    Kostas Daniilidis
Template gradient matching in spherical images
球形图像中的模板梯度匹配
Predicting the Future with Transformational States
用转型国家预测未来
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Andrew Jaegle;Oleh Rybkin;K. Derpanis;Kostas Daniilidis
  • 通讯作者:
    Kostas Daniilidis
Live Demonstration: Unsupervised Event-Based Learning of Optical Flow, Depth and Egomotion
现场演示:基于事件的无监督光流、深度和自我运动学习

Kostas Daniilidis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kostas Daniilidis', 18)}}的其他基金

Collaborative Research: Visual Tactile Neural Fields for Active Digital Twin Generation
合作研究:用于主动数字孪生生成的视觉触觉神经场
  • 批准号:
    2220868
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Closed Loop Perceptual Planning for Dynamic Locomotion
RI:中:协作研究:动态运动的闭环感知规划
  • 批准号:
    1703319
  • 财政年份:
    2017
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
MRI: Development of an Observatory for Quantitative Analysis of Collective Behavior in Animals
MRI:开发动物集体行为定量分析观测站
  • 批准号:
    1626008
  • 财政年份:
    2016
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
I/UCRC Phase I: Robots and Sensors for the Human Well-being
I/UCRC 第一阶段:造福人类福祉的机器人和传感器
  • 批准号:
    1439681
  • 财政年份:
    2014
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
NRI: Small: Collaborative Research: Active Sensing for Robotic Cameramen
NRI:小型:协作研究:机器人摄影师的主动传感
  • 批准号:
    1317947
  • 财政年份:
    2013
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
I-Corps: BlindNav: Indoor Navigation for the Visually Impaired
I-Corps:BlindNav:为视障人士提供室内导航
  • 批准号:
    1265129
  • 财政年份:
    2012
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
IGERT: Complex Scene Perception
IGERT:复杂场景感知
  • 批准号:
    0966142
  • 财政年份:
    2010
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
CDI-Type II: Collaborative Research: Perception of Scene Layout by Machines and Visually Impaired Users
CDI-Type II:协作研究:机器和视障用户对场景布局的感知
  • 批准号:
    1028009
  • 财政年份:
    2010
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
CDI-Type II: Collaborative Research: Cyber Enhancement of Spatial Cognition for the Visually Impaired
CDI-Type II:协作研究:视觉障碍者空间认知的网络增强
  • 批准号:
    0835714
  • 财政年份:
    2008
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Collaborative Research: Bio-inspired Navigation
RI:合作研究:仿生导航
  • 批准号:
    0713260
  • 财政年份:
    2007
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant

相似海外基金

Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313149
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Medium: Superhuman Imitation Learning from Heterogeneous Demonstrations
合作研究:RI:媒介:异质演示中的超人模仿学习
  • 批准号:
    2312955
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313150
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
RI: Medium: Foundations of Recourse Verification in Machine Learning
RI:媒介:机器学习资源验证的基础
  • 批准号:
    2313105
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Superhuman Imitation Learning from Heterogeneous Demonstrations
合作研究:RI:媒介:异质演示中的超人模仿学习
  • 批准号:
    2312956
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Medium: Foundations of Self-Supervised Learning Through the Lens of Probabilistic Generative Models
RI:媒介:通过概率生成模型的视角进行自我监督学习的基础
  • 批准号:
    2211907
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Bootstrapping natural feedback for reinforcement learning
合作研究:RI:中:引导强化学习的自然反馈
  • 批准号:
    2212310
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: MoDL: Occams Razor in Deep and Physical Learning
合作研究:RI:媒介:MoDL:深度学习和物理学习中的奥卡姆斯剃刀
  • 批准号:
    2212519
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Learning Compositional Implicit Representations for 3D Scene Understanding
合作研究:RI:媒介:学习 3D 场景理解的组合隐式表示
  • 批准号:
    2211258
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了