RI: Small: Learning Fine-Grained Instructions from Uncurated Complex Activity Videos
RI:小型:从未经策划的复杂活动视频中学习细粒度的指令
基本信息
- 批准号:2115110
- 负责人:
- 金额:$ 49.77万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Humans have the remarkable ability of learning to perform complex tasks by watching others performing them and following their instructions. Bringing this capability to machines has far reaching impact on the advancement of the artificial intelligence with important applications, such as designing intelligent assistants and robots that can learn to perform or guide humans through tasks by mining instructional and everyday activity videos. Despite recent advances, there are major challenges facing video and activity understanding methods to convert raw untrimmed long videos of complex activities into detailed and accurate instructions. These include large appearance and motion variations of instructions across videos, high cost of gathering dense temporal video annotations from long videos, lack of a systematic way of integrating different types of available noisy yet inexpensive labels for effective learning and difficulty of generating long-range future instructions. This project investigates a comprehensive mathematical framework for learning detailed and accurate instructions from untrimmed long complex activity videos, overcoming the aforementioned challenges. The research project is accompanied with an integrated education and outreach plan, which involves mentoring high school and undergraduate students through the Northeastern's Young Scholar Program and integrating the results of the project into the undergraduate and graduate classes. The project will publicly release an open-source software implementing the developed algorithms.This project develops new unsupervised and self-supervised task segmentation and subtask (instruction step) localization methods, by investigating a multi-manifold model for tasks and simultaneously learning and finding associations between manifolds across videos while incorporating task constraints and priors. The developed framework allows for handling large appearance and motion variations of subtasks across videos and allows for leveraging other modalities, such as video narrations and audio. The research team will develop a unified weakly-supervised visual grounding framework based on deep neural networks that learns from different types of available inexpensive noisy weak labels, handles subtasks at the distribution tail and generates future instructions from current observations. Furthermore, the team will investigate a new probabilistic deep learning framework with hierarchically connected modules corresponding to subtask, grammar and task prediction, allowing to integrate all types of weak labels and to generate plausible future subtask sequences.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人类有非凡的能力,通过观察别人执行任务并遵循他们的指示来学习执行复杂的任务。将这种能力带到机器上,对人工智能的发展具有深远的影响,具有重要的应用,例如设计智能助手和机器人,这些机器人可以通过挖掘教学和日常活动视频来学习执行或引导人类完成任务。尽管最近取得了一些进展,但视频和活动理解方法仍面临着重大挑战,即如何将复杂活动的原始、未经修剪的长视频转换为详细而准确的说明。这些问题包括视频中指令的外观和运动变化很大,从长视频中收集密集的时间视频注释的成本很高,缺乏系统地整合不同类型的可用噪声但廉价的标签以进行有效学习,以及难以生成远程未来指令。这个项目研究了一个全面的数学框架,用于从未经修剪的长而复杂的活动视频中学习详细和准确的说明,克服上述挑战。该研究项目伴随着一项综合的教育和推广计划,该计划包括通过东北青年学者计划指导高中生和本科生,并将该项目的结果整合到本科生和研究生班级中。该项目将公开发布实现开发的算法的开源软件。该项目开发了新的无监督和自我监督的任务分割和子任务(指令步骤)定位方法,通过研究任务的多流形模型,同时学习和发现视频中流形之间的关联,同时结合任务约束和先验。开发的框架允许在视频中处理子任务的较大外观和运动变化,并允许利用其他形式,如视频旁白和音频。研究团队将基于深度神经网络开发一个统一的弱监督视觉接地框架,该框架从不同类型的可用的廉价噪声弱标签中学习,在分布尾部处理子任务,并根据当前的观测生成未来的指令。此外,该团队将研究一个新的概率深度学习框架,该框架具有与子任务、语法和任务预测相对应的分层连接模块,允许集成所有类型的弱标签并生成看似合理的未来子任务序列。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Semi-Weakly-Supervised Learning of Complex Actions from Instructional Task Videos
- DOI:10.1109/cvpr52688.2022.00334
- 发表时间:2022-06
- 期刊:
- 影响因子:0
- 作者:Yuhan Shen;Ehsan Elhamifar
- 通讯作者:Yuhan Shen;Ehsan Elhamifar
Set-Supervised Action Learning in Procedural Task Videos via Pairwise Order Consistency
- DOI:10.1109/cvpr52688.2022.01928
- 发表时间:2022-06
- 期刊:
- 影响因子:0
- 作者:Zijia Lu;Ehsan Elhamifar
- 通讯作者:Zijia Lu;Ehsan Elhamifar
Learning to Segment Actions from Visual and Language Instructions via Differentiable Weak Sequence Alignment
学习通过可微弱序列对齐从视觉和语言指令中分割动作
- DOI:10.1109/cvpr46437.2021.01002
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Shen, Y.;Wang, L.;Elhamifar, E.
- 通讯作者:Elhamifar, E.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ehsan Elhamifar其他文献
High-Rank Matrix Completion and Clustering under Self-Expressive Models
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Ehsan Elhamifar - 通讯作者:
Ehsan Elhamifar
Sequential Facility Location: Approximate Submodularity and Greedy Algorithm
- DOI:
- 发表时间:
2019-05 - 期刊:
- 影响因子:0
- 作者:
Ehsan Elhamifar - 通讯作者:
Ehsan Elhamifar
Sparse modeling for high-dimensional multi-manifold data analysis
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:11.6
- 作者:
Ehsan Elhamifar - 通讯作者:
Ehsan Elhamifar
Automatic Calibration of Cameras with Special Motions
特殊运动相机的自动校准
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
R. Vidal;Ehsan Elhamifar - 通讯作者:
Ehsan Elhamifar
Adaptive Piecewise–Affine Inverse Modeling of Hybrid Dynamical Systems
混合动力系统的自适应分段仿射逆建模
- DOI:
10.3182/20140824-6-za-1003.02610 - 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Ehsan Elhamifar;Samuel A. Burden;S. Sastry - 通讯作者:
S. Sastry
Ehsan Elhamifar的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ehsan Elhamifar', 18)}}的其他基金
CRII: RI: Towards a Comprehensive Dynamic Subset Selection Framework
CRII:RI:迈向全面的动态子集选择框架
- 批准号:
1657197 - 财政年份:2017
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
相似国自然基金
新型非小细胞肺癌分次放疗进展模拟预测系统的开发与应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于联邦学习的小分子化合物质谱-结构
关系预测模型建立与应用
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
基于多模态组学与深度学习融合的小血管闭塞性卒中诊断模型构建及应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于表观建模与深度学习的低空红外小目标检测方法研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
恶性肿瘤精准诊治新技术和新策略研究-基于空间分割的肿瘤放射治疗计划智能优化技术的研发 及其在广泛期小细胞肺癌放疗联合免疫治疗中的应用研究
- 批准号:2025C02249(SD2)
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于深度学习构建非小细胞肺癌免疫检查点相关肺炎的预测模型
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多任务深度学习融合多模态数据术前精准预测IA期非小细胞肺癌亚肺叶切除术复发风险
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于增量学习的小微企业动态信用评价模型及其可解释性研究
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:青年科学基金项目
基于深度学习的多维影像学特征新方法评估非小细胞肺癌免疫治疗疗效的研究
- 批准号:
- 批准年份:2024
- 资助金额:0 万元
- 项目类别:青年科学基金项目
多源数据驱动下基于可解释机器学习的小微企业信用分险评估研究
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
- 批准号:
2345528 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232055 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
CISE-ANR: RI: Small: Numerically efficient reinforcement learning for constrained systems with super-linear convergence (NERL)
CISE-ANR:RI:小:具有超线性收敛 (NERL) 的约束系统的数值高效强化学习
- 批准号:
2315396 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232054 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
RI: Small: Approximate Inference for Planning and Reinforcement Learning
RI:小:规划和强化学习的近似推理
- 批准号:
2246261 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2334936 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313130 - 财政年份:2023
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: AF: Small: Long-Term Impact of Fair Machine Learning under Strategic Individual Behavior
合作研究:RI:AF:小:战略性个人行为下公平机器学习的长期影响
- 批准号:
2202699 - 财政年份:2022
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Advancing Theory and Practice of Trustworthy Machine Learning via Bi-Level Optimization
合作研究:RI:小型:通过双层优化推进可信机器学习的理论和实践
- 批准号:
2207052 - 财政年份:2022
- 资助金额:
$ 49.77万 - 项目类别:
Standard Grant