RI: Small: Visual How: Task Understanding and Description in the Real World

RI:小:视觉方式:现实世界中的任务理解和描述

基本信息

  • 批准号:
    2143197
  • 负责人:
  • 金额:
    $ 26.22万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-06-15 至 2025-05-31
  • 项目状态:
    未结题

项目摘要

Problem solving is an innate capability that humans develop through evolution and experience. Compared to human intelligence that can solve general and complex problems, current AI systems only perform well in narrow and structured tasks. With the overarching goal of bridging this gap, this project develops AI systems that can understand general real-world tasks (e.g., How to set up a tent? How to teach kids to garden? How to travel in London?) and come up with solutions with step-by-step language and visual guidance. It will allow for real-world tasks to be solved even in general and complex circumstances, resulting in more human-like AI. Ultimately, the project will take a step forward toward artificial general intelligence. The project will provide a publicly available dataset, a framework of computational models, and a mobile application prototype. Furthermore, this project will support integrated research and education with a focus on increasing minority participation through K-12 outreach, underrepresented and undergraduate mentoring, and curriculum development.This project proposes a VisualHow problem that represents a rich spectrum of real-world tasks. The generality and complexity of the problem call for capabilities to understand the visual and textual contents of the task, reason with knowledge relevant to the task, and generate step-by-step multimodal descriptions about how the task can be completed. This project aims to achieve these goals in three tasks. First, generate a new dataset with diverse and real-world tasks and solutions, with rich annotations of key semantics and task structures to guide the multimodal attention and structural reasoning. Second, develop a novel framework in which a series of models are derived for explainable VisualHow learning to understand the visual-textual contents and generate steps to complete real-world tasks. Third, develop novel methods to generalize the models with knowledge and validate them on mobile platforms to assist people in real-world applications. Achieving these goals will not only lead to new vision-language tasks and computational methods for real-world problem solving, but also spur innovations in the development of explainable and generalizable AI models and systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
解决问题是人类通过进化和经验发展的先天能力。与可以解决一般和复杂问题的人类智能相比,当前的AI系统仅在狭窄且结构化的任务中表现良好。凭借弥合这一差距的总体目标,该项目开发了可以理解一般现实世界任务的AI系统(例如,如何建立帐篷?如何教孩子们去伦敦旅行?)并通过逐步的语言和视觉指导提出解决方案。即使在一般和复杂的环境中,也可以解决现实世界的任务,从而导致更类似人类的AI。最终,该项目将迈向人工通用情报。该项目将提供公开可用的数据集,计算模型的框架和移动应用程序原型。此外,该项目将支持综合的研究和教育,重点是通过K-12外展,代表性不足和本科指导以及课程开发来增加少数群体的参与。该项目提出了一个视觉速度问题,代表着丰富的现实世界任务。问题的一般性和复杂性要求能够理解任务的视觉和文本内容,与任务相关的知识的原因,并生成有关如何完成任务的逐步多模式描述。该项目旨在在三个任务中实现这些目标。首先,生成一个具有多种多样和现实世界的任务和解决方案的新数据集,并使用关键语义和任务结构的丰富注释来指导多模式的关注和结构推理。其次,开发一个新颖的框架,在该框架中,一系列模型被得出可解释的视觉方式学习,以了解视觉文本内容并生成步骤以完成现实世界任务。第三,开发新的方法来概括具有知识的模型,并在移动平台上验证它们,以帮助人们进行现实世界中的应用程序。实现这些目标不仅会导致现实世界中解决问题的新型任务和计算方法,而且还将刺激创新的创新,以开发可解释且可推广的AI模型和系统。这项奖项反映了NSF的法定任务,并被认为是通过基金会的智力功能和广泛的影响来评估CRETIRIA的评估,以评估值得通过评估。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Divide and Conquer: Answering Questions with Object Factorization and Compositional Reasoning
  • DOI:
    10.48550/arxiv.2303.10482
  • 发表时间:
    2023-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shi Chen;Qi Zhao
  • 通讯作者:
    Shi Chen;Qi Zhao
VisualHow: Multimodal Problem Solving
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Qi Zhao其他文献

Characteristics of wheat dust flame with the influence of ceramic foam
泡沫陶瓷对小麦粉尘火焰特性的影响
  • DOI:
    10.1016/j.apt.2020.07.003
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    5.2
  • 作者:
    Qi Zhao;Huaming Dai;Xianfeng Chen;Chuyuan Huang;Hongming Zhang;Yi Li;Song He;Bihe Yuan;Pan Yang;Huiwei Zhu;Guangqian Liang;Bingqian Zhang
  • 通讯作者:
    Bingqian Zhang
Cleaning cycle optimization and cost evaluation of module dust for photovoltaic power plants in China
我国光伏电站组件粉尘清理周期优化及成本评估
Quantum coherence via conditional entropy
通过条件熵实现量子相干
The Effect of Governance Forms on North American Airport Efficiency: A Comparative Analysis of Airport Authority vs. Government Branch
治理形式对北美机场效率的影响:机场管理局与政府部门的比较分析
Rational Design of Multi-Target Estrogen Receptors ERα and ERβ by QSAR Approaches.
通过 QSAR 方法合理设计多靶点雌激素受体 ERα 和 ERβ。
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Qi Zhao;Yuxi Lu;Yan Zhao;Rongchao Li;F. Luan;M. Cordeiro
  • 通讯作者:
    M. Cordeiro

Qi Zhao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Qi Zhao', 18)}}的其他基金

Travel: Group Travel Grant for the Doctoral Consortium of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2023)
旅行:为 IEEE/CVF 计算机视觉和模式识别会议博士联盟 (CVPR 2023) 提供团体旅行补助金
  • 批准号:
    2325378
  • 财政年份:
    2023
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
EAGER: Interpretable and Generalizable AI for Smart Manufacturing
EAGER:用于智能制造的可解释和可推广的人工智能
  • 批准号:
    2227450
  • 财政年份:
    2022
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
RI: Small: Exploring Rationale behind Visual Understanding: Combining Attention and Reasoning
RI:小:探索视觉理解背后的基本原理:注意力和推理的结合
  • 批准号:
    1908711
  • 财政年份:
    2019
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
S&AS: FND: Context-Aware Active Data Gathering for Complex Outdoor Environments
S
  • 批准号:
    1849107
  • 财政年份:
    2019
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
Influence of Surface Properties of New Biomaterials for Catheters on Bacterial Adhesion in Urine
导管用新型生物材料表面特性对尿液中细菌粘附的影响
  • 批准号:
    EP/P00301X/1
  • 财政年份:
    2016
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Research Grant
SBIR Phase I: Bendable Ceramic Paper Membranes
SBIR 第一阶段:可弯曲陶瓷纸膜
  • 批准号:
    0910419
  • 财政年份:
    2009
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant

相似国自然基金

调节内质网蛋白质稳态保护青光眼视觉损害的小分子药物筛选及作用机制研究
  • 批准号:
    82373849
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于仿生视觉的近浅海水下小目标光学感知与识别方法
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目
融合光学和视觉原理的小模数粉末冶金齿轮高精度快速在线检测的理论及技术研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
融合光学和视觉原理的小模数粉末冶金齿轮高精度快速在线检测的理论及技术研究
  • 批准号:
    52175036
  • 批准年份:
    2021
  • 资助金额:
    58.00 万元
  • 项目类别:
    面上项目
面向边缘部署的弱先验小目标视觉检测与跟踪
  • 批准号:
    U21B2037
  • 批准年份:
    2021
  • 资助金额:
    255 万元
  • 项目类别:
    联合基金项目

相似海外基金

RI:Small: Modeling and Relating Visual Tasks
RI:Small:建模和关联视觉任务
  • 批准号:
    2329927
  • 财政年份:
    2023
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Continuing Grant
RI: Small: Toward Efficient and Robust Dynamic Scene Understanding Based on Visual Correspondences
RI:小:基于视觉对应的高效、鲁棒的动态场景理解
  • 批准号:
    2310254
  • 财政年份:
    2023
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
RI: Small: Learning 3D Equivariant Visual Representation for Animals
RI:小:学习动物的 3D 等变视觉表示
  • 批准号:
    2202024
  • 财政年份:
    2022
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
RI:Small: Improve Visual Tracking by Large Scale Learning, Diagnosis, and Evaluation
RI:Small:通过大规模学习、诊断和评估改进视觉跟踪
  • 批准号:
    2006665
  • 财政年份:
    2020
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
RI: Small: Visual Reasoning and Self-questioning for Explainable Visual Question Answering
RI:小:视觉推理和自我质疑以实现可解释的视觉问答
  • 批准号:
    2007613
  • 财政年份:
    2020
  • 资助金额:
    $ 26.22万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了