Second-order Hessian-free methods for statistical learning and stochastic optimization

用于统计学习和随机优化的二阶无 Hessian 方法

基本信息

  • 批准号:
    RGPIN-2022-04400
  • 负责人:
  • 金额:
    $ 3.13万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

The success of machine learning this last decade has had a deep impact in the mathematical optimization community and renewed interest in methods as stochastic gradient descent. Such an approach has the advantage to provide cheap iterations, allowing fast progress at the beginning of the optimization, and to avoid the storage of dense matrices, prohibited when dealing with a very large number of parameters. They however have difficulties to converge close to the solution, relying to vanishing step sizes to guarantee theoretical convergence. The algorithm can present difficulties to reach a vicinity of solution depending on the starting point. We investigate second-order Hessian-free strategies to capitalize on the existing nonlinear programming theory, while allowing to scale with the number of data and decision variables. The methods rely on adaptive sample average approximations (SAA), controlling the sample size with respect to the achieved estimated objective function reduction when compared to the statistical noise, within a trust-region framework and standard variance reduction techniques. At each iteration, quasi-Newton candidate iterates can be obtained without explicit matrix storage, and we explore how to use the structure of typical estimation problems to improve the approach. A second objective of the proposed research consists in capitalizing on the statistical information that we obtain on the model to develop better early stopping strategies. They are especially important as large samples are required close to the solution, leading to costly iterations. Another benefit is the possibility to provide the modeler with some information about the residual uncertainty at the found solution. We also explore the effect of observations that are not independently and identically distributed, as they could lead to biased solutions, and possibly have a negative impact on some social communities when the model is used to elaborate policies that impact individuals, for instance in transportation or energy. Similarly, model misspecifications are important to analyze, both in terms of algorithm convergence and in terms of solution robustness. Another important aspect that we consider is the feasible set as most of the optimization algorithms used in machine learning are designed for unconstrained problems only. However, many real applications, for instance in energy, include nonlinear constraints whose expressions can depend on the realization of the uncertainty, and the feasible set is not guaranteed to be convex. A standard approach is to turn to methods aiming to find a KKT solution, but stochastic approximation methods have received much less attention in this context, and SAA methods present additional challenges too, as adaptive sampling strategies face more difficulties to exploit the information geometry and the sample can have to be adjusted when it is important to satisfy some constraints for all or nearly all scenarios.
在过去的十年里,机器学习的成功在数学优化领域产生了深刻的影响,并重新引起了人们对随机梯度下降等方法的兴趣。这种方法的优点是提供廉价的迭代,允许在优化开始时快速进行,并避免存储密集矩阵,这在处理非常大量的参数时是被禁止的。然而,它们很难收敛到接近解的地方,依赖于逐渐消失的步长来保证理论上的收敛。根据起始点的不同,该算法可能很难达到解的附近。我们研究了二阶无黑森策略,以利用现有的非线性规划理论,同时允许随着数据和决策变量的数量而变化。该方法依赖于自适应样本平均近似(SAA),在信任域框架和标准方差减少技术内,相对于所实现的估计目标函数减少来控制样本大小。在每一次迭代中,无需存储显式矩阵,就可以得到拟牛顿候选迭代,并探索如何利用典型估计问题的结构来改进该方法。拟议研究的第二个目标是利用我们在该模型上获得的统计信息来制定更好的提前停止策略。它们尤其重要,因为在接近解决方案时需要大样本,这会导致昂贵的迭代。另一个好处是可以向建模者提供一些关于找到的解决方案的剩余不确定性的信息。我们还探讨了不独立和相同分布的观测的影响,因为它们可能导致有偏见的解决方案,并可能在模型用于制定影响个人的政策时对一些社会社区产生负面影响,例如在交通或能源方面。同样,无论是在算法的收敛方面还是在解的稳健性方面,模型错误规范都是需要分析的重要因素。我们考虑的另一个重要方面是可行集,因为机器学习中使用的大多数优化算法都是针对无约束问题设计的。然而,许多实际应用,例如在能源方面,包括非线性约束,其表达式取决于不确定性的实现,并且可行集并不保证是凸的。一种标准的方法是求助于寻找KKT解的方法,但在这种情况下,随机逼近方法受到的关注要少得多,而SAA方法也带来了额外的挑战,因为自适应采样策略面临着更多的困难来利用信息几何,并且当满足所有或几乎所有场景的某些约束非常重要时,样本可能不得不进行调整。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bastin, Fabian其他文献

Dynamic discrete choice model for railway ticket cancellation and exchange decisions

Bastin, Fabian的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Bastin, Fabian', 18)}}的其他基金

On the exploitation of uncertainty in exact and approximate optimization
关于精确和近似优化中不确定性的利用
  • 批准号:
    RGPIN-2017-05798
  • 财政年份:
    2021
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
On the exploitation of uncertainty in exact and approximate optimization
关于精确和近似优化中不确定性的利用
  • 批准号:
    RGPIN-2017-05798
  • 财政年份:
    2020
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
On the exploitation of uncertainty in exact and approximate optimization
关于精确和近似优化中不确定性的利用
  • 批准号:
    RGPIN-2017-05798
  • 财政年份:
    2019
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
Development of demand forecasting and inventory management models in the alcohol market
酒类市场需求预测和库存管理模型的开发
  • 批准号:
    528211-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Engage Grants Program
On the exploitation of uncertainty in exact and approximate optimization
关于精确和近似优化中不确定性的利用
  • 批准号:
    RGPIN-2017-05798
  • 财政年份:
    2018
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
Développement de modèles alternatifs de risque de crédits avec des réseaux artificiels de neurones
神经元人工研究风险的替代模型的开发
  • 批准号:
    521783-2017
  • 财政年份:
    2017
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Engage Grants Program
On the exploitation of uncertainty in exact and approximate optimization
关于精确和近似优化中不确定性的利用
  • 批准号:
    RGPIN-2017-05798
  • 财政年份:
    2017
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
Towards new solution techniques in mathematical programming with scenarios
迈向场景数学规划的新解决技术
  • 批准号:
    342368-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
Towards new solution techniques in mathematical programming with scenarios
迈向场景数学规划的新解决技术
  • 批准号:
    342368-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual
Towards new solution techniques in mathematical programming with scenarios
迈向场景数学规划的新解决技术
  • 批准号:
    342368-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

基于Order的SIS/LWE变体问题及其应用
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
体内亚核小体图谱的绘制及其调控机制研究
  • 批准号:
    32000423
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
CTCF/cohesin介导的染色质高级结构调控DNA双链断裂修复的分子机制研究
  • 批准号:
    32000425
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
异染色质修饰通过调控三维基因组区室化影响机体应激反应的分子机制
  • 批准号:
    31970585
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
骨髓间充质干细胞成骨成脂分化过程中染色质三维构象改变与转录调控分子机制研究
  • 批准号:
    31960136
  • 批准年份:
    2019
  • 资助金额:
    40.0 万元
  • 项目类别:
    地区科学基金项目
染色质三维结构等位效应的亲代传递研究
  • 批准号:
    31970586
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
染色质三维构象新型调控因子的机制研究
  • 批准号:
    31900431
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
转座因子调控多能干细胞染色质三维结构中的作用
  • 批准号:
    31970589
  • 批准年份:
    2019
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
Poisson Order, Morita 理论,群作用及相关课题
  • 批准号:
    19ZR1434600
  • 批准年份:
    2019
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于Kummer扩张的代数几何码的若干问题研究
  • 批准号:
    11701317
  • 批准年份:
    2017
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: First-principles Predictive Understanding of Chemical Order in Complex Concentrated Alloys: Structures, Dynamics, and Defect Characteristics
职业:复杂浓缩合金中化学顺序的第一原理预测性理解:结构、动力学和缺陷特征
  • 批准号:
    2415119
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Continuing Grant
Conference: North American High Order Methods Con (NAHOMCon)
会议:北美高阶方法大会 (NAHOMCon)
  • 批准号:
    2333724
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
Model order reduction for fast phase-field fracture simulations
快速相场断裂模拟的模型降阶
  • 批准号:
    EP/Y002474/1
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Research Grant
CAREER: Multiscale Reduced Order Modeling and Design to Elucidate the Microstructure-Property-Performance Relationship of Hybrid Composite Materials
职业:通过多尺度降阶建模和设计来阐明混合复合材料的微观结构-性能-性能关系
  • 批准号:
    2341000
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
CRII: OAC: Dynamically Adaptive Unstructured Mesh Technologies for High-Order Multiscale Fluid Dynamics Simulations
CRII:OAC:用于高阶多尺度流体动力学仿真的动态自适应非结构​​化网格技术
  • 批准号:
    2348394
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
Collaborative Research: Dynamics of Short Range Order in Multi-Principal Element Alloys
合作研究:多主元合金中的短程有序动力学
  • 批准号:
    2348956
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
Congestion control in complex networks with higher-order interactions
具有高阶交互的复杂网络中的拥塞控制
  • 批准号:
    DP240100963
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Discovery Projects
RII Track-4:NSF: Continental-scale, high-order, high-spatial-resolution, ice flow modeling based on graphics processing units (GPUs)
RII Track-4:NSF:基于图形处理单元 (GPU) 的大陆尺度、高阶、高空间分辨率冰流建模
  • 批准号:
    2327095
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
Collaborative Research: Dynamics of Short Range Order in Multi-Principal Element Alloys
合作研究:多主元合金中的短程有序动力学
  • 批准号:
    2348955
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
MCA: Problem-Based Learning for Warehousing and Order Fulfillment
MCA:基于问题的仓储和订单履行学习
  • 批准号:
    2322250
  • 财政年份:
    2024
  • 资助金额:
    $ 3.13万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了