EAGER: Learning Transferable Visual Features

EAGER:学习可迁移的视觉特征

基本信息

  • 批准号:
    2041307
  • 负责人:
  • 金额:
    $ 24.11万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-09-01 至 2024-08-31
  • 项目状态:
    已结题

项目摘要

Artificial intelligence and machine learning have shown great promise for many applications in computer vision, multimedia, robotics, autonomous driving, medical imaging analysis, assistive technology, etc. In order to obtain better performance, large-scale labeled data are generally required to train deep neural networks. To avoid extensive cost of collecting and annotating large-scale data, a major goal of machine learning is to exploit new algorithms to learn general features from limited labeled or unlabeled data. This project aims to explore self-supervised methods to learn general visual features across different modalities from large scale data without using any human-labeled annotations. The learned general visual features can then be transferred to many different applications, such as human activity analysis, 3D scene understanding, and assistive technologies. The research is tightly integrated with graduate/undergraduate education in the City University of New York, a minority serving institution and one of the most diverse campuses in the United States.Most prior work of visual feature learning has focused on a single modality of data. This research is to explore methods of learning transferable visual features from multiple modalities including texts, audios, images, videos, and 3D data as well as investigate new loss functions to find optimal features. In particular, the will conduct the following research tasks: (1) exploration of new algorithms to effectively learn transferable visual features across multimodalities without requesting human annotations of large scale data; (2) investigation of effective algorithms and loss functions for bridging the gap among different modalities to handle the different feature distributions from different modalities; and (3) evaluation and generalization of the proposed technologies on different applications including human activity analysis, 3D scene understanding, and medical image processing. The project will result in new algorithms to effectively learn transferable features from multimodality data including texts, images, videos, and 3D data without depending on data annotations. The work will lead to advances in computer vision and machine learning technologies and the outcome algorithms will be general and broadly applicable across different real-world applications.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人工智能和机器学习在计算机视觉、多媒体、机器人、自动驾驶、医学成像分析、辅助技术等领域的许多应用中显示出巨大的前景,为了获得更好的性能,通常需要大规模的标记数据来训练深度神经网络。为了避免收集和注释大规模数据的大量成本,机器学习的一个主要目标是利用新算法从有限的标记或未标记数据中学习一般特征。该项目旨在探索自我监督的方法,从大规模数据中学习不同模态的一般视觉特征,而不使用任何人类标记的注释。然后,学习到的一般视觉特征可以转移到许多不同的应用中,例如人类活动分析,3D场景理解和辅助技术。该研究与纽约城市大学的研究生/本科教育紧密结合,纽约城市大学是一所少数族裔服务机构,也是美国最多元化的校园之一。视觉特征学习的大多数先前工作都集中在单一的数据模式上。本研究旨在探索从多种形式(包括文本,音频,图像,视频和3D数据)中学习可转移视觉特征的方法,并研究新的损失函数以找到最佳特征。特别是,将进行以下研究任务:(1)探索新的算法,以有效地学习跨多模态的可转移视觉特征,而无需对大规模数据进行人工注释;(2)研究有效的算法和损失函数,以弥合不同模态之间的差距,以处理来自不同模态的不同特征分布;以及(3)对所提出的技术在不同应用(包括人体活动分析、3D场景理解和医学图像处理)上的评估和推广。该项目将产生新的算法,以有效地从多模态数据(包括文本,图像,视频和3D数据)中学习可转移的特征,而不依赖于数据注释。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
FESTA: Flow Estimation via Spatial-Temporal Attention for Scene Point Clouds
PSMNet: Position-aware Stereo Merging Network for Room Layout Estimation
Medical Image Tampering Detection: a New Dataset and Baseline
医学图像篡改检测:新的数据集和基线
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Reichman, B;Jing, L;Akin, O;Tian, Y.
  • 通讯作者:
    Tian, Y.
AI-Driven Robust Kidney and Renal Mass Segmentation and Classification on 3D CT Images.
AI驱动的3D CT图像上的稳健肾脏和肾脏质量分割和分类。
Nonverbal Communication Cue Recognition: A Pathway to More Accessible Communication
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

YingLi Tian其他文献

YingLi Tian的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('YingLi Tian', 18)}}的其他基金

IEEE International Conference on Multimedia and Expo (ICME) 2014: Doctoral Consortium
IEEE 国际多媒体会议 (ICME) 2014:博士联盟
  • 批准号:
    1419299
  • 财政年份:
    2014
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
CHS: Medium: Collaborative Research: Immediate Feedback to Support Learning American Sign Language through Multisensory Recognition
CHS:媒介:协作研究:通过多感官识别支持学习美国手语的即时反馈
  • 批准号:
    1400802
  • 财政年份:
    2014
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
AIR Option 1: Technology Translation: Automated Targeted Destination Recognition for the Blind with Motion Deblurring
AIR 选项 1:技术翻译:通过运动去模糊为盲人自动识别目标目的地
  • 批准号:
    1343402
  • 财政年份:
    2013
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
Context-based Indoor Object Detection
基于上下文的室内物体检测
  • 批准号:
    0957016
  • 财政年份:
    2009
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Towards Engaged, Personalized and Transferable Learning of Secure Programming by Leveraging Real-World Security Vulnerabilities
协作研究:利用现实世界的安全漏洞实现安全编程的参与式、个性化和可转移学习
  • 批准号:
    2235976
  • 财政年份:
    2023
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
Collaborative Research: Towards Engaged, Personalized and Transferable Learning of Secure Programming by Leveraging Real-World Security Vulnerabilities
协作研究:利用现实世界的安全漏洞实现安全编程的参与式、个性化和可转移学习
  • 批准号:
    2235224
  • 财政年份:
    2023
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
CPS: SMALL: Formal Methods for Safe, Efficient, and Transferable Learning-enabled Autonomy
CPS:SMALL:安全、高效和可迁移的学习自主的正式方法
  • 批准号:
    2231257
  • 财政年份:
    2023
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
CAREER: Learning and Sharing Transferable Grounded Object Knowledge for Collaborative Robots
职业:学习和分享协作机器人的可转移接地物体知识
  • 批准号:
    2239764
  • 财政年份:
    2023
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Continuing Grant
Towards Transferable Machine Learning Interatomic Potentials for Reactive Organic Chemistry in Solution
迈向溶液中反应性有机化学的可转移机器学习原子间势
  • 批准号:
    2751535
  • 财政年份:
    2022
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Studentship
CRII: III: Knowledge Graph Completion with Transferable Representation Learning
CRII:III:通过可迁移表示学习完成知识图谱
  • 批准号:
    2105329
  • 财政年份:
    2021
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
ATD: Inductive Spatiotemporal Graph Encoding for Interpretable and Transferable Deep Learning with Application in Human Dynamics
ATD:用于可解释和可迁移深度学习的归纳时空图编码及其在人体动力学中的应用
  • 批准号:
    2124493
  • 财政年份:
    2021
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
ATD: Inductive Spatiotemporal Graph Encoding for Interpretable and Transferable Deep Learning with Application in Human Dynamics
ATD:用于可解释和可迁移深度学习的归纳时空图编码及其在人体动力学中的应用
  • 批准号:
    2124535
  • 财政年份:
    2021
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Standard Grant
Building Robust and Transferable Machine Learning Systems through Continual Learning
通过持续学习构建强大且可迁移的机器学习系统
  • 批准号:
    552812-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
Personality and meta-learning in terms of neural transferable factors
神经可转移因素方面的人格和元学习
  • 批准号:
    19H04180
  • 财政年份:
    2019
  • 资助金额:
    $ 24.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了