AF: RI: Medium: Collaborative Research: Understanding and Improving Optimization in Deep and Recurrent Networks

AF:RI:中:协作研究:理解和改进深度和循环网络的优化

基本信息

  • 批准号:
    1764032
  • 负责人:
  • 金额:
    $ 54.11万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Machine learning using deep neural networks has recently demonstrated broad empirical success. Despite this success, the optimization procedures that fit deep neural networks to data are still poorly understood. Besides playing a crucial role in fitting deep neural networks to data, optimization also strongly affects the model's ability to generalize from training examples to unseen data. This project will establish a working theory for why and when large artificial neural networks train and generalize well, and use this theory to develop new optimization methods. The utility of the new methods will be demonstrated in applications involving language, speech, biological sequences and other sequence data. The project will involve training of graduate and undergraduate students, and the project leaders will offer tutorials aimed at both the machine learning community, and other researchers and engineers using machine learning tools. In order to establish a theory of why and when non-convex optimization works well when training deep networks, both empirical top-down and analytic bottom-up approaches will be pursued. The top-down approach will involve phenomenological analysis of large scale deep models used in practice, both when presented with real data, and when presented with data specifically crafted to test the behavior of the network. The bottom-up approach will involve precise analytic investigation from increasingly more complex models, starting with linear models, and non-convex matrix factorization, progressing through linear neural networks, models with a small number of hidden layers, and eventually reaching deeper and more complex networks. The theory developed aims to be both explanatory and actionable, and will be used to derive new optimization methods and modifications to architectures that aid in optimization and generalization. A particularly important testbed is the case of recurrent neural networks. Recurrent neural networks are powerful sequence models that maintain state as they process an input sequence and are used for sequence data. Particularly challenging to optimize, recurrent neural networks still leave much room for a stronger principled understanding, which the project aims to provide.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
使用深神经网络的机器学习最近证明了广泛的经验成功。尽管取得了成功,但适合深度神经网络数据的优化程序仍然对数据的理解仍然很差。除了在将深度神经网络拟合到数据中起着至关重要的作用外,优化还强烈影响该模型从训练示例到看不见的数据的概括能力。该项目将建立一个工作理论,说明为什么以及何时大型人工神经网络训练和概括,并使用该理论来开发新的优化方法。新方法的实用性将在涉及语言,语音,生物序列和其他序列数据的应用中证明。该项目将涉及培训研究生和本科生,项目负责人将提供针对机器学习社区的教程,以及使用机器学习工具的其他研究人员和工程师。为了建立一个理论以及何时在训练深层网络时非凸优化效果很好的理论,将采用经验性的自上而下和分析自下而上的方法。自上而下的方法将涉及对实践中使用的大规模深模型的现象学分析,无论是在带有真实数据时,都将介绍专门用于测试网络行为的数据时。自下而上的方法将涉及越来越复杂的模型(从线性模型开始)和非凸矩阵分解的精确分析研究,通过线性神经网络进行,具有少量隐藏层的模型,并最终达到更深入且更复杂的网络。所开发的理论旨在既是解释性又可行,并将用于为有助于优化和概括的体系结构提供新的优化方法和修改。一个特别重要的测试是复发性神经网络的情况。复发性神经网络是强大的序列模型,它们在处理输入序列并用于序列数据时保持状态。优化反复的神经网络特别具有挑战性,仍留出很大的原则性理解的空间,该项目旨在提供该奖项。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子和更广泛影响的评估评估标准来通过评估来获得支持的。

项目成果

期刊论文数量(33)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Characterizing Implicit Bias in Terms of Optimization Geometry
  • DOI:
  • 发表时间:
    2018-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suriya Gunasekar;Jason D. Lee;Daniel Soudry;N. Srebro
  • 通讯作者:
    Suriya Gunasekar;Jason D. Lee;Daniel Soudry;N. Srebro
On the Implicit Bias of Initialization Shape: Beyond Infinitesimal Mirror Descent
  • DOI:
  • 发表时间:
    2021-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shahar Azulay;E. Moroshko;M. S. Nacson;Blake E. Woodworth;N. Srebro;A. Globerson;Daniel Soudry
  • 通讯作者:
    Shahar Azulay;E. Moroshko;M. S. Nacson;Blake E. Woodworth;N. Srebro;A. Globerson;Daniel Soudry
Pessimism for Offline Linear Contextual Bandits using Confidence Sets
使用置信集对离线线性上下文强盗的悲观态度
Benign Overfitting in Linear Classifiers and Leaky ReLU Networks from KKT Conditions for Margin Maximization
  • DOI:
    10.48550/arxiv.2303.01462
  • 发表时间:
    2023-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Spencer Frei;Gal Vardi;P. Bartlett;N. Srebro
  • 通讯作者:
    Spencer Frei;Gal Vardi;P. Bartlett;N. Srebro
Efficiently Learning Adversarially Robust Halfspaces with Noise
  • DOI:
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Omar Montasser;Surbhi Goel;Ilias Diakonikolas;N. Srebro
  • 通讯作者:
    Omar Montasser;Surbhi Goel;Ilias Diakonikolas;N. Srebro
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nathan Srebro其他文献

Score Design for Multi-Criteria Incentivization
多标准激励的评分设计
Fixed-structure H∞ controller design based on Distributed Probabilistic Model-Building Genetic Algorithm
基于分布式概率建模遗传算法的固定结构H∞控制器设计
On the Complexity of Learning Sparse Functions with Statistical and Gradient Queries
关于通过统计和梯度查询学习稀疏函数的复杂性
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nirmit Joshi;Theodor Misiakiewicz;Nathan Srebro
  • 通讯作者:
    Nathan Srebro

Nathan Srebro的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nathan Srebro', 18)}}的其他基金

HDR TRIPODS: Collaborative Research: Institute for Data, Econometrics, Algorithms and Learning
HDR TRIPODS:协作研究:数据、计量经济学、算法和学习研究所
  • 批准号:
    1934843
  • 财政年份:
    2019
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Continuing Grant
CCF-BSF: AF: Small: Convex and Non-Convex Distributed Learning
CCF-BSF:AF:小:凸和非凸分布式学习
  • 批准号:
    1718970
  • 财政年份:
    2018
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning
BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近
  • 批准号:
    1546500
  • 财政年份:
    2015
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
RI: AF: Medium: Learning and Matrix Reconstruction with the Max-Norm and Related Factorization Norms
RI:AF:中:使用最大范数和相关因式分解范数进行学习和矩阵重建
  • 批准号:
    1302662
  • 财政年份:
    2013
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Continuing Grant

相似国自然基金

跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
    32200568
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research:RI:AF:Medium:Exchanging Knowledge Beyond Data Between Human and Machine Learner
协作研究:RI:AF:Medium:在人类和机器学习者之间交换数据之外的知识
  • 批准号:
    1956339
  • 财政年份:
    2020
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: AF: Medium: Exchanging Knowledge Beyond Data Between Human and Machine Learner
协作研究:RI:AF:媒介:在人类和机器学习者之间交换数据之外的知识
  • 批准号:
    1956441
  • 财政年份:
    2020
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
AF: RI: Medium: Collaborative Research: Understanding and Improving Optimization in Deep and Recurrent Networks
AF:RI:中:协作研究:理解和改进深度和循环网络的优化
  • 批准号:
    1763562
  • 财政年份:
    2018
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
AF: RI: Medium: Collaborative Research: Understanding and Improving Optimization in Deep and Recurrent Networks
AF:RI:中:协作研究:理解和改进深度和循环网络的优化
  • 批准号:
    1764033
  • 财政年份:
    2018
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Standard Grant
RI: AF: Medium: Learning and Matrix Reconstruction with the Max-Norm and Related Factorization Norms
RI:AF:中:使用最大范数和相关因式分解范数进行学习和矩阵重建
  • 批准号:
    1302662
  • 财政年份:
    2013
  • 资助金额:
    $ 54.11万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了