Decentralised learning and networked communication in large populations of AI decision makers
大量人工智能决策者的分散学习和网络通信
基本信息
- 批准号:2577365
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2021
- 资助国家:英国
- 起止时间:2021 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Brief description of the context of the research including potential impactSystems of numerous interacting autonomous decision makers ('agents') are likely to play an increasing role in many areas of our society, economy and infrastructure, with potential benefits for disaster response, financial markets, smart cities and energy grids, environmental monitoring and other cyber-physical systems. However, there is an explosion in computational complexity as the population size increases, making them difficult to scale for real-world usage. 'Mean-Field Games' (MFGs) are an area of game theory related to statistical physics, which can be combined with machine learning to address the scalability issue. Nevertheless, methods for solving MFGs have traditionally relied on idealised assumptions that are unrealistic in practice. Aims and ObjectivesI wish to bridge the gap between the abstract theory of MFGs and their practical usage in real-world problems. In particular, I am introducing inter-agent communication into the framework, to remove the reliance of theoretical techniques on the existence of a single controller that `puppeteers' all the agents. This can bring benefits in terms of robustness, flexibility and speed of convergence. Novelty of the research methodologyMFGs remain a relatively underexplored area, especially with regards to the desiderata we may have for complex systems to be trained and deployed in the real world, such as decentralised learning. My introduction of inter-agent communication to the MFG framework is a novel contribution. Alignment to EPSRC's strategies and research areas (which EPSRC research area the project relates to) Further information on the areas can be found on http://www.epsrc.ac.uk/research/ourportfolio/researchareas/Research into large multi-agent systems is at the heart of several EPSRC research areas, including 'AI technologies', 'control engineering' and 'verification and correctness', with potential application to the likes of 'ICT networks and distributed systems' and 'infrastructure and urban systems'. Any companies or collaborators involved None currently.
对研究背景的简要说明,包括潜在影响众多相互作用的自主决策者系统(“代理人”)可能在我们的社会、经济和基础设施的许多领域发挥越来越大的作用,对灾害应对、金融市场、智能城市和能源电网、环境监测和其他网络物理系统具有潜在的好处。然而,随着种群规模的增加,计算复杂性呈爆炸式增长,这使得它们难以扩展以适应现实世界的使用。Mean-field Games(MFGS)是与统计物理相关的博弈论领域,它可以与机器学习相结合来解决可伸缩性问题。然而,解决MFG的方法传统上依赖于在实践中不切实际的理想化假设。目的和目的我希望在MFGs的抽象理论和它们在现实世界问题中的实际应用之间架起一座桥梁。特别是,我正在将代理之间的通信引入该框架,以消除理论技术对存在的单个控制器的依赖,该控制器是所有代理的“傀儡操纵者”。这可以在稳健性、灵活性和收敛速度方面带来好处。研究方法的新颖性MFGs仍然是一个相对未被探索的领域,特别是关于我们可能对复杂系统进行培训并在现实世界中部署的愿望,例如分散学习。我将代理间通信引入MFG框架是一个新的贡献。与EPSRC的战略和研究领域(项目涉及的EPSRC研究领域)保持一致,有关这些领域的更多信息可以在http://www.epsrc.ac.uk/research/ourportfolio/researchareas/Research上找到,大型多代理系统是EPSRC几个研究领域的核心,包括“人工智能技术”、“控制工程”和“验证和正确性”,潜在地应用于“ICT网络和分布式系统”和“基础设施和城市系统”等领域。目前没有任何公司或合作者参与其中。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
- 批准号:31971003
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
- 批准号:61702207
- 批准年份:2017
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
- 批准号:
2339112 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Learning, Estimation, and Control of Networked Epidemic Processes
职业:网络化流行病过程的学习、估计和控制
- 批准号:
2238388 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: Consensus and Distributed Optimization in Non-Convex Environments with Applications to Networked Machine Learning
协作研究:非凸环境中的共识和分布式优化及其在网络机器学习中的应用
- 批准号:
2240789 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
FreeML: Engineering Networked Machine Learning via Meta-Free Energy Minimisation
FreeML:通过无元能量最小化进行工程网络机器学习
- 批准号:
EP/W024101/1 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Fellowship
Travel Grant: Conference on New Frontiers in Networked Dynamical Systems: Assured Learning, Communication, and Control
差旅补助金:网络动态系统新领域会议:有保证的学习、通信和控制
- 批准号:
2335461 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: Consensus and Distributed Optimization in Non-Convex Environments with Applications to Networked Machine Learning
协作研究:非凸环境中的共识和分布式优化及其在网络机器学习中的应用
- 批准号:
2240788 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Cooperation of networked multi robot systems using control theory and machine learning
使用控制理论和机器学习的网络化多机器人系统的协作
- 批准号:
DGDND-2022-04277 - 财政年份:2022
- 资助金额:
-- - 项目类别:
DND/NSERC Discovery Grant Supplement
Learning-Aided Distributed Estimation and Control for Networked Vehicular Systems
网络车辆系统的学习辅助分布式估计和控制
- 批准号:
RGPIN-2020-05097 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
PANDA-MSD: Predictive Analytics via Networked Distributed Algorithms for Multi-System Diseases
PANDA-MSD:通过网络分布式算法对多系统疾病进行预测分析
- 批准号:
10368562 - 财政年份:2022
- 资助金额:
-- - 项目类别:
PANDA-MSD: Predictive Analytics via Networked Distributed Algorithms for Multi-System Diseases
PANDA-MSD:通过网络分布式算法对多系统疾病进行预测分析
- 批准号:
10677539 - 财政年份:2022
- 资助金额:
-- - 项目类别: