CRII: AF: Optimization and sampling algorithms with provable generalization and runtime guarantees, with applications to deep learning

CRII:AF:具有可证明的泛化性和运行时保证的优化和采样算法,以及深度学习的应用

基本信息

  • 批准号:
    2104528
  • 负责人:
  • 金额:
    $ 17.42万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-06-01 至 2023-05-31
  • 项目状态:
    已结题

项目摘要

When training deep-learning and other machine-learning models, one would like to train in such a way that the generalization error of the trained model, that is, the error of the trained model when it is used to make predictions on a “test” dataset which was not used to train the model, is as low as possible. Training algorithms with good generalization properties can lead to machine-learning models that are more robust to changes in the dataset, allow for robust predictions, and help mitigate algorithmic bias when the training dataset may not be fully representative of the diversity of the population dataset. Such algorithms can also lead to more stable training in settings such as distributed training and online learning. In practice, the choice of optimization algorithm that one uses to train the model can greatly affect both its training error and generalization error. Unfortunately, there is a lack of optimization algorithms with provable guarantees on the generalization error. This makes it difficult to design algorithms which provably achieve both a fast running time and low generalization error. The aim of this project is to design novel algorithms for training deep-learning and other machine-learning models, and to prove guarantees on the running time, generalization error and related robustness properties of these algorithms. To design and analyze such algorithms, this project brings together ideas from different areas of mathematics and computer science.This project is designing novel optimization and Markov-chain sampling algorithms, for training deep-learning models as well as other machine-learning models. It aims to prove guarantees on the generalization error and related robustness properties of these algorithms, and also to provide fast running-time guarantees. Guaranteeing a low generalization error is especially challenging in deep learning, since the number of trainable parameters is oftentimes much larger than the size of the dataset, and the loss function used to train the model is nonconvex. To prove stronger generalization and related robustness guarantees, the project team uses ideas from manifold learning and differential geometry to model the low-dimensional structure of datasets which arise in many machine learning applications. The project has three components. One component is to design and analyze novel optimization algorithms for training deep learning models. Another component is to design and analyze algorithms for multi-agent optimization problems, such as the min-max optimization problems which arise when training generative adversarial nets (GANs) as well as multi-agent optimization problems which arise when training meta-learning models. Finally, in addition to optimization algorithms, it is also designing and analyzing Markov-chain sampling algorithms and related algorithms which are used to train Bayesian machine learning models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在训练深度学习和其他机器学习模型时,人们希望以这样的方式进行训练,即训练模型的泛化误差,即当训练模型用于对未用于训练模型的“测试”数据集进行预测时,训练模型的误差尽可能低。具有良好泛化特性的训练算法可以产生对数据集变化更鲁棒的机器学习模型,允许鲁棒的预测,并在训练数据集可能不能完全代表群体数据集的多样性时帮助减轻算法偏差。这样的算法还可以在分布式训练和在线学习等环境中实现更稳定的训练。在实践中,用于训练模型的优化算法的选择可以极大地影响其训练误差和泛化误差。 不幸的是,目前还缺乏对泛化误差具有可证明保证的优化算法。 这使得设计可证明同时实现快速运行时间和低泛化误差的算法变得困难。 该项目的目的是设计用于训练深度学习和其他机器学习模型的新算法,并证明这些算法的运行时间,泛化误差和相关鲁棒性的保证。 为了设计和分析这些算法,该项目汇集了数学和计算机科学不同领域的想法。该项目正在设计新颖的优化和马尔可夫链采样算法,用于训练深度学习模型以及其他机器学习模型。 它的目的是证明这些算法的泛化误差和相关的鲁棒性的保证,并提供快速运行时间的保证。 在深度学习中,确保低泛化误差尤其具有挑战性,因为可训练参数的数量通常比数据集的大小大得多,并且用于训练模型的损失函数是非凸的。 为了证明更强的泛化能力和相关的鲁棒性保证,项目团队使用流形学习和微分几何的思想来建模许多机器学习应用中出现的数据集的低维结构。该项目有三个组成部分。 其中一个组成部分是设计和分析用于训练深度学习模型的新型优化算法。 另一个组成部分是设计和分析多智能体优化问题的算法,例如训练生成对抗网络(GAN)时出现的最小-最大优化问题以及训练元学习模型时出现的多智能体优化问题。 最后,除了优化算法之外,还设计和分析马尔可夫链抽样算法和用于训练贝叶斯机器学习模型的相关算法。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估而被认为值得支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Sampling from Log-Concave Distributions with Infinity-Distance Guarantees
具有无限距离保证的对数凹分布采样
Private Matrix Approximation and Geometry of Unitary Orbits
单一轨道的私有矩阵近似和几何
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mangoubi, Oren;Wu, Yikai;Kale, Satyen;Thakurta, Abhradeep G;Vishnoi, Nisheeth K
  • 通讯作者:
    Vishnoi, Nisheeth K
Data-Driven Soil Water Content Estimation at Multiple Depths Using SFCW GPR
  • DOI:
    10.1109/orss58323.2023.10161940
  • 发表时间:
    2023-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Vincent Filardi;Allen Cheung;Ruba Khan;Oren Mangoubi;Majid Moradikia;S. Zekavat;B. Wilson;Radwin Askari;D. Petkie
  • 通讯作者:
    Vincent Filardi;Allen Cheung;Ruba Khan;Oren Mangoubi;Majid Moradikia;S. Zekavat;B. Wilson;Radwin Askari;D. Petkie
Re-Analyze Gauss: Bounds for Private Matrix Approximation via Dyson Brownian Motion
重新分析高斯:通过戴森布朗运动的私有矩阵近似的界限
A Convergent and Dimension-Independent Min-Max Optimization Algorithm
  • DOI:
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Vijay Keswani;Oren Mangoubi;Sushant Sachdeva;Nisheeth K. Vishnoi
  • 通讯作者:
    Vijay Keswani;Oren Mangoubi;Sushant Sachdeva;Nisheeth K. Vishnoi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Oren Mangoubi其他文献

A KERNEL RANDOM MATRIX-BASED APPROACH
基于内核随机矩阵的方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Oren Mangoubi;Nisheeth K. Vishnoi
  • 通讯作者:
    Nisheeth K. Vishnoi
Cross-modal interaction between temperature and light color temperature on reading comprehension
温度与光色温对阅读理解的跨模态相互作用
  • DOI:
    10.1016/j.buildenv.2025.112751
  • 发表时间:
    2025-04-15
  • 期刊:
  • 影响因子:
    7.600
  • 作者:
    Xingtong Guo;Wei Luo;Oren Mangoubi;Shichao Liu
  • 通讯作者:
    Shichao Liu
Nonconvex sampling with the Metropolis-adjusted Langevin algorithm
使用 Metropolis 调整的 Langevin 算法进行非凸采样
F ASTER S AMPLING FROM L OG -C ONCAVE D ENSITIES OVER P OLYTOPES VIA E FFICIENT L INEAR S OLVERS
通过高效线性求解器对多面体上的对数凹面密度进行更快的采样
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Oren Mangoubi;Nisheeth K. Vishnoi
  • 通讯作者:
    Nisheeth K. Vishnoi
Mixing of Hamiltonian Monte Carlo on strongly log-concave distributions: Continuous dynamics
哈密​​顿蒙特卡罗在强对数凹分布上的混合:连续动力学

Oren Mangoubi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于前瞻性队列的双酚AF联合果糖加重代谢损伤的靶向代谢组学研究
  • 批准号:
    2025JJ30049
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2-circMMP1信号轴促进结直肠癌进展的分子机制研究
  • 批准号:
    2025JJ80723
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2精氯酸甲基化调控RNA转录合成在MTAP缺失骨肉瘤T细胞耗竭中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目
BDA-366通过MYD88/NF-κB/PGC1β通路杀伤 KMT2A/AF9 AML细胞的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
Lu AF21934减少缺血性脑卒中导致的神经损伤的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
  • 批准号:
    32372727
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
  • 批准号:
    82300739
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
  • 批准号:
    82370157
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
线粒体活性氧介导的胎盘早衰在孕期双酚AF暴露致婴幼儿神经发育迟缓中的作用
  • 批准号:
    82304160
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
  • 批准号:
    82303789
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
  • 批准号:
    2422926
  • 财政年份:
    2024
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
  • 批准号:
    2402572
  • 财政年份:
    2024
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
AF: Small: Memory Bounded Optimization and Learning
AF:小:内存限制优化和学习
  • 批准号:
    2341890
  • 财政年份:
    2024
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
  • 批准号:
    2402571
  • 财政年份:
    2024
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
AF: Small: Advances in Private Optimization
AF:小:私人优化的进展
  • 批准号:
    2211718
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Sampling and Optimization under Global Constraints
合作研究:AF:小型:全局约束下的采样和优化
  • 批准号:
    2309708
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
AF: Small: Low-Degree Methods for Optimization in Random Structures. Power and Limitations
AF:小:随机结构优化的低度方法。
  • 批准号:
    2233897
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
CAREER: AF: Fast Algorithms for Riemannian Optimization
职业:AF:黎曼优化的快速算法
  • 批准号:
    2410328
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Continuing Grant
CAREER: AF: Fast Algorithms for Riemannian Optimization
职业:AF:黎曼优化的快速算法
  • 批准号:
    2239228
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Continuing Grant
NSF-BSF: AF: Small: Parameter-Free Stochastic Optimization via Trajectory Cues
NSF-BSF:AF:小:通过轨迹线索进行无参数随机优化
  • 批准号:
    2239527
  • 财政年份:
    2023
  • 资助金额:
    $ 17.42万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了