Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
基本信息
- 批准号:2312841
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-07-01 至 2026-06-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Deep learning has demonstrated unprecedented performance across various domains in engineering and science. However, the theoretical understanding of their success has remained elusive. Very recently, researchers discovered and characterized an elegant mathematical structure within the learned features and classifiers called Neural Collapse. This phenomenon persists across a variety of different network architectures, datasets, and data domains. This project will leverage the symmetry of Neural Collapse to develop a rigorous mathematical theory to explain when and why it happens and how it can be used to quantify generalization performance and provide guidelines to understand and improve transferability. By advancing the mathematical foundations of deep learning, this project is expected to influence not only the machine learning community, but also related areas such as optimization, signal and image processing, and natural language processing. The project also involves an integrated outreach and education plan, including promoting accessibility and awareness of computing and STEM concepts for K-12 students.This project will expand our understanding of the principles behind non-convex optimization of training deep learning models, and provide new mathematical insights on their generalization and transferability properties, leading to practical implications. In particular, the project is focused on the following three overarching research thrusts: (i) provide a unified framework to analyze convergence guarantees for training deep and overparametrized models through general loss functions to states of neural collapse, first for simplified cases and then for more general deep models that exhibit progressive neural collapse, with multi-labels and data imbalance; (ii) harness the structure of neural collapse to provide tighter generalization bounds for deep models, by characterizing the structure of the resulting classifiers and their mild dependence on the training data, as well as by making natural distributional assumptions; (iii) leverage the generalization of progressive neural collapse to new environments to understand transferability of deep models to new domains and tasks, and develop principled approaches for improving transferability and efficient fine-tuning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度学习在工程和科学的各个领域都表现出前所未有的性能。然而,对他们成功的理论理解仍然难以捉摸。最近,研究人员在学习特征和分类器中发现并描述了一个优雅的数学结构,称为神经崩溃。这种现象在各种不同的网络体系结构、数据集和数据域中持续存在。该项目将利用神经崩溃的对称性来发展一个严格的数学理论来解释它何时和为什么发生,以及如何使用它来量化泛化性能,并为理解和提高可转移性提供指导。通过推进深度学习的数学基础,该项目预计不仅会影响机器学习社区,还会影响优化、信号和图像处理以及自然语言处理等相关领域。该项目还涉及一项综合外展和教育计划,包括促进K-12学生对计算机和STEM概念的可及性和认识。该项目将扩展我们对训练深度学习模型的非凸优化背后原理的理解,并为其泛化和可转移性提供新的数学见解,从而产生实际意义。特别是,该项目侧重于以下三个总体研究重点:(i)提供一个统一的框架,通过神经崩溃状态的一般损失函数来分析训练深度和过度参数化模型的收敛保证,首先用于简化情况,然后用于表现出渐进神经崩溃的更一般的深度模型,具有多标签和数据不平衡;(ii)通过描述结果分类器的结构及其对训练数据的轻微依赖,以及通过做出自然分布假设,利用神经崩溃的结构为深度模型提供更严格的泛化界限;(iii)利用渐进式神经崩溃在新环境中的泛化来理解深度模型在新领域和任务中的可转移性,并开发原则性方法来提高可转移性和有效的微调。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jeremias Sulam其他文献
Nonlinear slight parameter changes detection: a forecasting approach
非线性微小参数变化检测:一种预测方法
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Jeremias Sulam;E. Torres;F. Ingenier - 通讯作者:
F. Ingenier
Sparsity-aware generalization theory for deep neural networks
深度神经网络的稀疏感知泛化理论
- DOI:
10.48550/arxiv.2307.00426 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Ramchandran Muthukumar;Jeremias Sulam - 通讯作者:
Jeremias Sulam
Examination-Level Supervision for Deep Learning-based Intracranial Hemorrhage Detection on Head CT Scans.
基于深度学习的头部 CT 扫描颅内出血检测的考试级监督。
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Jacopo Teneggi;P. Yi;Jeremias Sulam - 通讯作者:
Jeremias Sulam
High Dimensional Dictionary Learning and Applications
高维字典学习与应用
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Jeremias Sulam;M. Zibulevsky;Michael Elad - 通讯作者:
Michael Elad
Effect of motion, cortical orientation and spatial resolution on quantitative imaging of cortical Rsub2/sub* and magnetic susceptibility at 0.3 mm in-plane resolution at 7 T
运动、皮质取向和空间分辨率对 7T 下 0.3mm 平面内分辨率皮质 R₂*和磁化率定量成像的影响
- DOI:
10.1016/j.neuroimage.2023.119992 - 发表时间:
2023-04-15 - 期刊:
- 影响因子:4.500
- 作者:
Peter van Gelderen;Xu Li;Jacco A. de Zwart;Erin S. Beck;Serhat V. Okar;Yujia Huang;KuoWei Lai;Jeremias Sulam;Peter C.M. van Zijl;Daniel S. Reich;Jeff H. Duyn;Jiaen Liu - 通讯作者:
Jiaen Liu
Jeremias Sulam的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jeremias Sulam', 18)}}的其他基金
CAREER: Interpretable and Robust Machine Learning Models: Analysis and Algorithms
职业:可解释且稳健的机器学习模型:分析和算法
- 批准号:
2239787 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
Collaborative Research: CIF: Small: Deep Sparse Models: Analysis and Algorithms
合作研究:CIF:小型:深度稀疏模型:分析和算法
- 批准号:
2007649 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
相似国自然基金
醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
- 批准号:2025JJ90117
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病
中的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
- 批准号:82301120
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
- 批准号:82300022
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
- 批准号:2022J011347
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
- 批准号:2022JJ70115
- 批准年份:2022
- 资助金额:0.0 万元
- 项目类别:省市级项目
IL-1RI/PI3Kδ/FOXO1途径促进HBV感染早期HBsAb产生的分子机制研究
- 批准号:
- 批准年份:2021
- 资助金额:0.0 万元
- 项目类别:省市级项目
树突状细胞来源的外泌体携带槲皮素抑制 IgE/FcεRI信号通路治疗过敏性鼻炎的作用及机制研究
- 批准号:
- 批准年份:2021
- 资助金额:10.0 万元
- 项目类别:省市级项目
相似海外基金
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312842 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313151 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232298 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312840 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
- 批准号:
2345528 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
- 批准号:
2312374 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
- 批准号:
2312373 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232055 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313149 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant