Optimization methods for deep learning: training and testing in machine learning

深度学习的优化方法:机器学习中的训练和测试

基本信息

  • 批准号:
    2282418
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2019
  • 资助国家:
    英国
  • 起止时间:
    2019 至 无数据
  • 项目状态:
    已结题

项目摘要

This project falls within the EPSRC numerical analysis research areas.This project is undertaken with Industrial Partner NAG.Optimization problems form the modelling and numerical core of machine learning and statistical methodologies, such as in the training of supervised machine learning classifiers. In such applications, a large amount of data (feature vectors) is available that has been already classified (namely labelled). Then a parameterised classifier is selected and trained on this data, namely, values of the parameters are calculated so that the output of the classifier at the given features matches their labels in some optimal way. The ensuing classifier is then used for testing, in order to label/classify unseen data. The training problem is formulated as an optimization problem that minimises, for example, the average amount of errors that the classifier makes on the test set. Various formulations of the optimization problem are used, most commonly considering some continuous loss function to measure the error at each data point and either (deterministic) finite sum or (probabilistic) expectation of the loss terms as the total error; the latter may be convex (such as in the case of binary classification) but, more and more nowadays, it may instead be nonconvex due to the prevalence of deep learning applications. The scale of the ensuing optimization is commonly huge, with millions of parameters and terms in the objective sum of functions. This makes the calculation of a single function or gradient value prohibitively expensive and leads to the need for inexact optimization algorithms that effectively exploit problem structure. The practical method of choice in ML applications is the (batch) stochastic gradient method (Robbins-Munro, 1950) that computes only the gradients of a small, randomly chosen number of the loss terms and controls both variance and convergence by means of a predefined stepsize. A grand challenge in this area is how to augment stochastic gradient methods with inexact second order derivative information, so as to obtain more efficient methods especially in the nonconvex case of deep learning, both in terms of achieving higher accuracy but also robustness to ill-conditioning. In this project, we will investigate ways to approximate second-order information in the finite-sum structure of ML optimization problems, from subsampling second-order derivatives to approximating them by differences in batch gradients, such as in block (stochastic) quasi-Newton approaches and Gauss-Newton methods. In place of the usual predefined stepsize, we will consider the impact of more sophisticated stepsize techniques from classical optimization that are adaptive to local optimization landscapes such as variable/adaptive trust-region radius, regularization and linesearch. We will also consider preconditioning techniques that contain inexpensive second-derivative information so as to help the performance of first order methods. We will also investigate parallel and decentralised implementations of these methods, which is a challenge especially for higher-order techniques.Potential outcomes:(i) State-of-the-art deep learning and optimization formulations and methods for machine learning.(ii) Novel optimization methods that use inexact (deterministic/stochastic) problem information.(iii) Evaluation of methods for deep neural net training and testing.
该项目属于EPSRC数值分析研究领域。该项目由工业合作伙伴NAG承担。优化问题构成了机器学习和统计方法的建模和数值核心,例如在监督机器学习分类器的训练中。在这些应用中,有大量已经分类(即标记)的数据(特征向量)可用。然后选择一个参数化分类器并在此数据上进行训练,即计算参数的值,使分类器在给定特征处的输出以某种最优方式与它们的标签匹配。随后的分类器用于测试,以便标记/分类未见过的数据。训练问题被表述为最小化的优化问题,例如,最小化分类器在测试集上产生的平均错误量。使用了各种优化问题的公式,最常见的是考虑一些连续损失函数来测量每个数据点的误差,并将损失项的(确定性)有限和或(概率)期望作为总误差;后者可能是凸的(例如在二元分类的情况下),但由于深度学习应用的普及,它可能越来越多地是非凸的。随后的优化规模通常是巨大的,在函数的目标和中有数百万个参数和项。这使得单个函数或梯度值的计算成本过高,并导致需要有效利用问题结构的不精确优化算法。机器学习应用中的实际选择方法是(批)随机梯度方法(Robbins-Munro, 1950),该方法仅计算少量随机选择的损失项的梯度,并通过预定义的步长控制方差和收敛。该领域的一个重大挑战是如何用不精确的二阶导数信息增强随机梯度方法,从而获得更有效的方法,特别是在深度学习的非凸情况下,既要达到更高的精度,又要具有对病态的鲁棒性。在这个项目中,我们将研究在ML优化问题的有限和结构中近似二阶信息的方法,从次抽样二阶导数到通过批梯度的差异来近似它们,例如块(随机)准牛顿方法和高斯-牛顿方法。代替通常预定义的步长,我们将考虑来自经典优化的更复杂的步长技术的影响,这些技术可适应局部优化景观,如可变/自适应信任域半径、正则化和线研究。我们还将考虑包含廉价二阶导数信息的预处理技术,以帮助一阶方法的性能。我们还将研究这些方法的并行和分散实现,这对高阶技术来说是一个挑战。潜在成果:(i)最先进的深度学习和优化机器学习的公式和方法。(ii)使用不精确(确定性/随机)问题信息的新颖优化方法。(三)评价深度神经网络训练和测试方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

复杂图像处理中的自由非连续问题及其水平集方法研究
  • 批准号:
    60872130
  • 批准年份:
    2008
  • 资助金额:
    28.0 万元
  • 项目类别:
    面上项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Biologically-engineered Transcatheter Vein Valve: Design Optimization and Preclinical Testing
生物工程经导管静脉瓣膜:设计优化和临床前测试
  • 批准号:
    10594865
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Optimization of Calcium and RNA multiplexed activity imaging for highly parallelized evaluation of cell type functions in deep-brain structures
钙和 RNA 多重活性成像的优化,用于高度并行评估深部脑结构中的细胞类型功能
  • 批准号:
    10401603
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Deep learning Based Phenotyping and Treatment Optimization for Heart Failure with Preserved Ejection Fraction
基于深度学习的射血分数保留的心力衰竭表型分析和治疗优化
  • 批准号:
    10444412
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Patient Specific Parameter Optimization of Thalamic Stimulation for Treatment of Epilepsy
用于治疗癫痫的丘脑刺激的患者特定参数优化
  • 批准号:
    10700113
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Enhancement and optimization of a mobile iBCI for Veterans with paralysis
为瘫痪退伍军人增强和优化移动 iBCI
  • 批准号:
    10538008
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Model-based optimization of pain management in surgical patients
基于模型的手术患者疼痛管理优化
  • 批准号:
    10536063
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
ADAPTIVE MOTIF-BASED CONTROL (AMBC): A FUNDAMENTALLY NEW APPROACH TO AUTOMATED TREATMENT OPTIMIZATION FOR TYPE 1 DIABETES
自适应基序控制 (AMBC):1 型糖尿病自动优化治疗的全新方法
  • 批准号:
    10684819
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Optimization of Tau PET Imaging for Alzheimer's Disease through Deep Learning-Based Image Reconstruction
通过基于深度学习的图像重建优化阿尔茨海默病的 Tau PET 成像
  • 批准号:
    10501804
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Patient Specific Parameter Optimization of Thalamic Stimulation for Treatment of Epilepsy
用于治疗癫痫的丘脑刺激的患者特定参数优化
  • 批准号:
    10522867
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Optimization-based statistical methods: functional estimation, sparsity, compound decisions, and deep learning
基于优化的统计方法:函数估计、稀疏性、复合决策和深度学习
  • 批准号:
    RGPIN-2020-04424
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了