Machine Learning through the Lenses of Optimal Transportation

从最佳交通的角度进行机器学习

基本信息

  • 批准号:
    2744976
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2022
  • 资助国家:
    英国
  • 起止时间:
    2022 至 无数据
  • 项目状态:
    未结题

项目摘要

This research project proposes to investigate some analytical and numerical aspects of the training of wide multi-layered neural networks using the modern theory of optimal transportation. Optimal mass transportation is a relatively new area in mathematics, but it has received a huge momentum in the past twenty years or so, culminating in the 2018 Fields medal of A. Figalli. This theory has had great impact and influence on fields as partial differential equations, probability theory and statistics, geometry and data science, with important applications in meteorology, economics, biology and social sciences, to list a few.Applied to machine learning, optimal mass transportation has had early successes, in the framework of supervised and unsupervised learning.The results have quickly found industrial applications, such as models based on variational auto-encoders and generative adversarial networks.The key objective in training a neural network is to identify a function that will accurately evaluate unseen data based on a given training set. Unfortunately, identifying this prediction function is itself a challenging optimisation problem, which can be solved only approximately and with many constraints through numerical methods. In the past, this has been achieved through techniques such as back propagation and stochastic gradient descent. However, such methods do not scale well as the number of neurons increases, making them infeasible for many practical applications.Thanks to recent developments in optimal transport, it is now possible to find prediction functions for infinitely wide single-layer neural networks.This is done by solving partial differential equations derived from so-called Wasserstein gradient flows, a key mechanism in optimal transport.Thus far, however, this mathematical framework is only applicable to single-layer neural networks, a key limitation acknowledged recently by Figalli et al.To address this open problem, we seek to develop, as the backbone of this project, a mathematical framework to use Wasserstein gradient flows to find prediction functions on neural networks with two or more layers.The tools of optimal transportation thus allow us to approximate the very-many-neuron problem, not by fewer neurons, but by a continuum (i.e. infinitely many) of them, reminiscent to the mean-field models in statistical physics. Our second objective is to quantify how good these approximations are, not only in the usual analytical sense of obtaining qualitative bounds that are often of little practical use, but also sharp bounds that align well with what is observed in applications. For this, we plan to use techniques from mean-field games (a new area initiated by another Fields medallist, P.-L. Lions, and his collaborators).Numerical computations will form an important part of this project, in the first instance to test our mathematical framework as it develops (not whether it is correct, but how directly applicable it is to real-life problems). Existing computational techniques, however, could only handle discrete (if many) neurons.Over the course of this project, as our third objective, we will need to develop numerical models, along with the requisite computational techniques, that couple discrete neurons with (an approximation of) a continuum of neurons. This will start with a single layer, progressing to multiple layers as we gain experience.
本研究计划将探讨利用现代最佳运输理论训练多层神经网路的分析与数值方法。最优质量运输是数学中一个相对较新的领域,但在过去二十年左右的时间里,它获得了巨大的动力,最终在2018年获得了菲尔兹奖。费加利这一理论对偏微分方程、概率论和统计、几何和数据科学等领域产生了巨大的影响和影响,在气象学、经济学、生物学和社会科学等领域都有重要的应用。应用于机器学习,在监督和无监督学习的框架下,最优公共交通已经取得了早期的成功。结果很快就找到了工业应用,例如基于变分自动编码器和生成对抗网络的模型。训练神经网络的关键目标是识别一个函数,该函数将基于给定的训练集准确地评估未见过的数据。不幸的是,识别这个预测函数本身就是一个具有挑战性的优化问题,它只能近似地通过数值方法解决,并且有许多约束。在过去,这已经通过诸如反向传播和随机梯度下降之类的技术来实现。然而,随着神经元数量的增加,这种方法不能很好地扩展,使得它们在许多实际应用中不可行。由于最佳传输的最新发展,现在可以找到无限宽单层神经网络的预测函数。这是通过求解由所谓的Wasserstein梯度流(最佳传输的关键机制)导出的偏微分方程来实现的。然而,到目前为止,这个数学框架只适用于单层神经网络,这是Figalli等人最近承认的一个关键限制。为了解决这个开放的问题,我们寻求开发,作为这个项目的骨干,一个数学框架,使用Wasserstein梯度流在两层或多层神经网络上找到预测函数。因此,最优传输工具允许我们近似非常多神经元的问题,不是通过更少的神经元,而是通过它们的连续体(即无限多个),让人想起统计物理学中的平均场模型。我们的第二个目标是量化这些近似值有多好,不仅是在通常的分析意义上获得的定性界限,往往是很少的实际用途,但也尖锐的界限,以及在应用中观察到的。为此,我们计划使用平均场比赛(由另一位菲尔兹奖得主P. L.数值计算将成为这个项目的重要组成部分,首先是测试我们的数学框架的发展(不是它是否正确,而是它在现实生活中的直接应用)。然而,现有的计算技术只能处理离散的(如果有很多)神经元。在这个项目的过程中,作为我们的第三个目标,我们将需要开发数值模型,沿着必要的计算技术,将离散神经元与连续的神经元(近似)耦合起来。这将从一个单一的层开始,随着我们获得经验,逐步发展到多个层。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Investigating the potential for developing self-regulation in foreign language learners through the use of computer-based large language models and machine learning
通过使用基于计算机的大语言模型和机器学习来调查外语学习者自我调节的潜力
  • 批准号:
    24K04111
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Privacy-preserving machine learning through secure management of data's lifecycle in distributed systems: REMINDER
通过安全管理分布式系统中的数据生命周期来保护隐私的机器学习:提醒
  • 批准号:
    EP/Y036301/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
Adopting Green Solvents through Predicting Reaction Outcomes with AI/Machine Learning
通过人工智能/机器学习预测反应结果采用绿色溶剂
  • 批准号:
    EP/X021033/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
Improving NHS perimenopausal diagnosis and HRT prescription through AI, machine learning and big data
通过人工智能、机器学习和大数据改善 NHS 围绝经期诊断和 HRT 处方
  • 批准号:
    10053966
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Collaborative Research: Advancing the Science of STEM Interest Development through Educational Gameplay with Machine Learning and Data-driven Interviews
合作研究:通过机器学习和数据驱动访谈的教育游戏推进 STEM 兴趣发展科学
  • 批准号:
    2301173
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Discovery of early immunologic biomarkers for risk of PTLDS through machine learning-assisted broad temporal profiling of humoral immune response
通过机器学习辅助的体液免疫反应的广泛时间分析发现 PTLDS 风险的早期免疫生物标志物
  • 批准号:
    10738144
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Collaborative Research: Advancing the Science of STEM Interest Development through Educational Gameplay with Machine Learning and Data-driven Interviews
合作研究:通过机器学习和数据驱动访谈的教育游戏推进 STEM 兴趣发展科学
  • 批准号:
    2301172
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Innovative prediction method for for chemical-induced developmental toxicity using causal inference through machine learning.
通过机器学习进行因果推理来预测化学品引起的发育毒性的创新方法。
  • 批准号:
    23H03555
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Optimization and Validation of a Cost-effective Image-Guided Automated Extracapsular Extension Detection Framework through Interpretable Machine Learning in Head and Neck Cancer
通过可解释的机器学习在头颈癌中优化和验证具有成本效益的图像引导自动囊外扩展检测框架
  • 批准号:
    10648372
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
IUCRC Phase II Georgia Institute of Technology: Center for Advanced Electronics through Machine Learning [CAEML]
IUCRC 第二期佐治亚理工学院:机器学习先进电子学中心 [CAEML]
  • 批准号:
    2345055
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了