Algorithms for Multi-agent Reinforcement Learning in Complex Environments
复杂环境下多智能体强化学习算法
基本信息
- 批准号:2427742
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2020
- 资助国家:英国
- 起止时间:2020 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project will investigate the combination of causal inference and deep reinforcement learning to design an algorithm with the ability to learn causal relationships through exploration in a multi-agent system. The goal is for an agent to apply the learned causal relationships to decision-making and transfer causal knowledge to new environments.
该项目将研究因果推理和深度强化学习的结合,以设计一种能够通过多智能体系统中的探索来学习因果关系的算法。我们的目标是一个代理应用学到的因果关系的决策和因果知识转移到新的环境。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Temporal Disentanglement of Representations for Improved Generalisation in Reinforcement Learning
- DOI:10.48550/arxiv.2207.05480
- 发表时间:2022-07
- 期刊:
- 影响因子:0
- 作者:Mhairi Dunion;Trevor A. McInroe;K. Luck;Josiah P. Hanna;Stefano V. Albrecht
- 通讯作者:Mhairi Dunion;Trevor A. McInroe;K. Luck;Josiah P. Hanna;Stefano V. Albrecht
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
基于Multi-Agent动态联盟机制的多重约束海洋平台项目多模态调度协调优化研究
- 批准号:51679059
- 批准年份:2016
- 资助金额:62.0 万元
- 项目类别:面上项目
金融市场multi-agent异质信息的风险形成机理及预警研究
- 批准号:71301047
- 批准年份:2013
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于复杂网络与Multi-Agent融合的金融市场间风险溢出效应研究
- 批准号:71371051
- 批准年份:2013
- 资助金额:56.0 万元
- 项目类别:面上项目
面向新能源大规模集中并网的电力系统协调规划理论模型及其Multi-Agent模拟分析方法研究
- 批准号:71271082
- 批准年份:2012
- 资助金额:42.0 万元
- 项目类别:面上项目
基于Multi-Agent的应急状态下协同供应链数据集成研究
- 批准号:61272513
- 批准年份:2012
- 资助金额:81.0 万元
- 项目类别:面上项目
物联网背景下基于Multi-Agent的道路交通需求建模与仿真研究
- 批准号:71203045
- 批准年份:2012
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
基于Multi-Agent的企业动态联盟合作中信任问题研究
- 批准号:71271067
- 批准年份:2012
- 资助金额:56.0 万元
- 项目类别:面上项目
基于Multi-Agent协商的高堆石坝施工度汛风险演化机理及其控制
- 批准号:51279137
- 批准年份:2012
- 资助金额:82.0 万元
- 项目类别:面上项目
基于本体的应急物流Multi-Agent建模与应急任务协作求解
- 批准号:71101152
- 批准年份:2011
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
Multi-Agent架构智能机器人推理机实时性研究
- 批准号:61175094
- 批准年份:2011
- 资助金额:58.0 万元
- 项目类别:面上项目
相似海外基金
CAREER: Reinforcement Learning-Based Control of Heterogeneous Multi-Agent Systems in Structured Environments: Algorithms and Complexity
职业:结构化环境中异构多智能体系统的基于强化学习的控制:算法和复杂性
- 批准号:
2237830 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
Resilient distributed algorithms for multi-agent systems
多智能体系统的弹性分布式算法
- 批准号:
22KF0137 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
Collaborative Research: Differential Equations Motivated Multi-Agent Sequential Deep Learning: Algorithms, Theory, and Validation
协作研究:微分方程驱动的多智能体序列深度学习:算法、理论和验证
- 批准号:
2152717 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: Differential Equations Motivated Multi-Agent Sequential Deep Learning: Algorithms, Theory, and Validation
协作研究:微分方程驱动的多智能体序列深度学习:算法、理论和验证
- 批准号:
2152762 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Advancing Mathematical Models and Algorithms for Decentralized Optimization in Complex Multi-agent Networks
职业:推进复杂多智能体网络中分散优化的数学模型和算法
- 批准号:
2323159 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
CRII: RI: Secure Multi-Agent Reinforcement Learning Algorithms
CRII:RI:安全多代理强化学习算法
- 批准号:
2105007 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Advancing Mathematical Models and Algorithms for Decentralized Optimization in Complex Multi-agent Networks
职业:推进复杂多智能体网络中分散优化的数学模型和算法
- 批准号:
1944500 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Standard Grant
Near-Optimal Scalable Algorithms for Multi-Agent Reinforcement Learning
多智能体强化学习的近乎最优可扩展算法
- 批准号:
2444539 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Studentship
NSF-BSF:RI:Small:Collaborative Research:Next-Generation Multi-Agent Path Finding Algorithms
NSF-BSF:RI:小型:协作研究:下一代多智能体路径查找算法
- 批准号:
1815660 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Standard Grant
NSF-BSF:RI:Small:Collaborative Research:Next-Generation Multi-Agent Path Finding Algorithms
NSF-BSF:RI:小型:协作研究:下一代多智能体路径查找算法
- 批准号:
1817189 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Standard Grant