登录/注册

调研领500喵币

开通猫会员

用户头像

{{ userInfo.nickname }}

个人中心

ID: {{ userInfo.uid }}

复制

会员有效期至{{dayjs(userInfo?.membership_time * 1000).format('YYYY.MM.DD')}}

开通会员尊享 16+ 权益

{{isVip ? '立即续费' : '立即开通'}}

智能选题

智能选题

课程8折

智能标书

文献分析

文献分析

更多特权

更多特权

剩余喵币

{{userInfo.mew_coin_count}}

{{userInfo.over_mew_coin || 0}}喵币将在本周失效

专属邀请码

复制

{{userInfo.share?.code}}

邀好友注册得200喵币/人任务中心

任务中心

退出账号

{{loginType === 2 ? '微信扫码注册' : '欢迎来到猫眼课题宝'}}

登录二维码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

为了保证账户安全，请在
微信「猫眼课题宝」内点击授权

重新扫码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

账号注册

您好~为了给您提供更精准的分析体验，需完善基础信息！所有信息100%保密，请放心填写！

立即使用

切换微信登录

*注：建议或bug反馈被采纳后获得{{feedback_mew_coin}}喵币奖励，请关注公众号模版消息通知

取消

提交

已收到您的反馈，我们会尽快处理。若内容被采纳你将获得{{feedback_mew_coin}}喵币奖励。请关注《猫眼课题宝》消息通知。

{{ChannelMewCoin}}

喵币已到账！

*喵币用于产品体验解锁使用，有效期 30 天

在猫眼课题宝您可以：

{{item.title}}

{{item.desc}}

微信扫码添加小助理，回复“调研”
领取调研问卷

首次添加还可额外获得
{{customer_mew_coin}}喵币奖励哦！

完成问卷填写，立得{{question_mew_coin}}喵币奖励

永久回看权已生效！

直播主题

《{{latestCourse?.name}}》

立即去查看

7天猫会员

有效期至：{{dayjs(userInfo.membership_time * 1000).format('YYYY-MM-DD HH:mm')}}

已送您“7天会员体验卡+500喵币”

次数升级

享智能标书等多功能月解锁次数1次

10次

优享折扣

获会员期内充值喵币 8折等3大折扣

开心收下

永久回看权已生效！

课程

《{{giftRes?.img}}》

立即去查看

永久回看权已生效！

课程

《{{receiveTrainingCourseInfo?.name}}》

立即去查看

{{userInfo?.nickname}}

猫会员

{{vipStr}}

后失效

·查看权益对比·

猫会员

（全方位提升课题决策能力）

会员专属

升级猫会员：购买喵币享 8 折优惠

免费领最高 6W 喵币

二维码

{{qrCodeError}}

请先阅读
服务协议并同意

扫码添加「专属客服」
了解团购优惠方案

客服在线时间：工作日9:00-18:00

￥

{{currentInfo?.price}}

已优惠{{ _.floor(_.toNumber(currentInfo.original_price) - _.toNumber(currentInfo.price), 0) }}元

倒计时

支持：

支付宝

支付宝/

微信

*信息服务类购买后不支持退款

请阅读并同意《猫眼课题宝服务协议》

常见问题

会员权益说明

会员权益对比

权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

- 微信扫一扫 -

请添加您的「专属会员管家」
提供专属会员服务

Algorithms for Multi-agent Reinforcement Learning in Complex Environments

复杂环境下多智能体强化学习算法

基本信息

批准号：
2427742
负责人：
金额：
--
依托单位：
University of Edinburgh
依托单位国家：
英国
项目类别：
Studentship
财政年份：
2020
资助国家：
英国
起止时间：
2020 至无数据
项目状态：
未结题

来源：
https://gtr.ukri.org/projects?ref=studentship-2427742
关键词：
Algorithms Multi agent Reinforcement Learning

项目摘要

This project will investigate the combination of causal inference and deep reinforcement learning to design an algorithm with the ability to learn causal relationships through exploration in a multi-agent system. The goal is for an agent to apply the learned causal relationships to decision-making and transfer causal knowledge to new environments.

该项目将研究因果推理和深度强化学习的结合，以设计一种能够通过多智能体系统中的探索来学习因果关系的算法。我们的目标是一个代理应用学到的因果关系的决策和因果知识转移到新的环境。

项目成果

期刊论文数量（2）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Temporal Disentanglement of Representations for Improved Generalisation in Reinforcement Learning

DOI：
10.48550/arxiv.2207.05480
发表时间：
2022-07
期刊：
ArXiv
影响因子：
0
作者：
Mhairi Dunion;Trevor A. McInroe;K. Luck;Josiah P. Hanna;Stefano V. Albrecht
通讯作者：
Mhairi Dunion;Trevor A. McInroe;K. Luck;Josiah P. Hanna;Stefano V. Albrecht

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

其他文献

吉治仁志他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)

Hitoshi Yoshiji 等：“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

LiDAR Implementations for Autonomous Vehicle Applications

DOI：
发表时间：
2021
期刊：
影响因子：
0
作者：
通讯作者：

生命分子工学・海洋生命工学研究室

生物分子工程/海洋生物技术实验室

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

吉治仁志他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)

Hitoshi Yoshiji 等人：“血管医学与科学系列分子医学图解”Yodosha（涉谷正志编辑）125（2000）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)

钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响：“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

的其他文献

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers

用于实时测量循环生物标志物的植入式生物传感器微系统

批准号：
2901954
财政年份：
2028
资助金额：
--
项目类别：
Studentship

Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions

利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案

批准号：
2896097
财政年份：
2027
资助金额：
--
项目类别：
Studentship

A Robot that Swims Through Granular Materials

可以在颗粒材料中游动的机器人

批准号：
2780268
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.

严重空间天气事件对核电和保障监督的恢复力的可能性和影响。

批准号：
2908918
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface

质子、α 和 γ 辐照辅助应力腐蚀开裂：了解燃料-不锈钢界面

批准号：
2908693
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Field Assisted Sintering of Nuclear Fuel Simulants

核燃料模拟物的现场辅助烧结

批准号：
2908917
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Assessment of new fatigue capable titanium alloys for aerospace applications

评估用于航空航天应用的新型抗疲劳钛合金

批准号：
2879438
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in

使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型，以分析白细胞介素 17 抑制剂的细胞和表观遗传效应

批准号：
2890513
财政年份：
2027
资助金额：
--
项目类别：
Studentship

CDT year 1 so TBC in Oct 2024

CDT 第 1 年，预计 2024 年 10 月

批准号：
2879865
财政年份：
2027
资助金额：
--
项目类别：
Studentship

Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds

了解野生鸟类肠道微生物组、行为和城市化之间的相互作用

批准号：
2876993
财政年份：
2027
资助金额：
--
项目类别：
Studentship

相似国自然基金

基于Multi-Agent动态联盟机制的多重约束海洋平台项目多模态调度协调优化研究

批准号：
51679059
批准年份：
2016
资助金额：
62.0 万元
项目类别：
面上项目

金融市场multi-agent异质信息的风险形成机理及预警研究

批准号：
71301047
批准年份：
2013
资助金额：
20.0 万元
项目类别：
青年科学基金项目

基于复杂网络与Multi-Agent融合的金融市场间风险溢出效应研究

批准号：
71371051
批准年份：
2013
资助金额：
56.0 万元
项目类别：
面上项目

面向新能源大规模集中并网的电力系统协调规划理论模型及其Multi-Agent模拟分析方法研究

批准号：
71271082
批准年份：
2012
资助金额：
42.0 万元
项目类别：
面上项目

基于Multi-Agent的应急状态下协同供应链数据集成研究

批准号：
61272513
批准年份：
2012
资助金额：
81.0 万元
项目类别：
面上项目

物联网背景下基于Multi-Agent的道路交通需求建模与仿真研究

批准号：
71203045
批准年份：
2012
资助金额：
19.0 万元
项目类别：
青年科学基金项目

基于Multi-Agent的企业动态联盟合作中信任问题研究

批准号：
71271067
批准年份：
2012
资助金额：
56.0 万元
项目类别：
面上项目

基于Multi-Agent协商的高堆石坝施工度汛风险演化机理及其控制

批准号：
51279137
批准年份：
2012
资助金额：
82.0 万元
项目类别：
面上项目

基于本体的应急物流Multi-Agent建模与应急任务协作求解

批准号：
71101152
批准年份：
2011
资助金额：
20.0 万元
项目类别：
青年科学基金项目

Multi-Agent架构智能机器人推理机实时性研究

批准号：
61175094
批准年份：
2011
资助金额：
58.0 万元
项目类别：
面上项目

相似海外基金

CAREER: Reinforcement Learning-Based Control of Heterogeneous Multi-Agent Systems in Structured Environments: Algorithms and Complexity

职业：结构化环境中异构多智能体系统的基于强化学习的控制：算法和复杂性

批准号：
2237830
财政年份：
2023
资助金额：
--
项目类别：
Continuing Grant

Resilient distributed algorithms for multi-agent systems

多智能体系统的弹性分布式算法

批准号：
22KF0137
财政年份：
2023
资助金额：
--
项目类别：
Grant-in-Aid for JSPS Fellows

Collaborative Research: Differential Equations Motivated Multi-Agent Sequential Deep Learning: Algorithms, Theory, and Validation

协作研究：微分方程驱动的多智能体序列深度学习：算法、理论和验证

批准号：
2152717
财政年份：
2022
资助金额：
--
项目类别：
Standard Grant

Collaborative Research: Differential Equations Motivated Multi-Agent Sequential Deep Learning: Algorithms, Theory, and Validation

协作研究：微分方程驱动的多智能体序列深度学习：算法、理论和验证

批准号：
2152762
财政年份：
2022
资助金额：
--
项目类别：
Standard Grant

CAREER: Advancing Mathematical Models and Algorithms for Decentralized Optimization in Complex Multi-agent Networks

职业：推进复杂多智能体网络中分散优化的数学模型和算法

批准号：
2323159
财政年份：
2022
资助金额：
--
项目类别：
Standard Grant

CRII: RI: Secure Multi-Agent Reinforcement Learning Algorithms

CRII：RI：安全多代理强化学习算法

批准号：
2105007
财政年份：
2021
资助金额：
--
项目类别：
Standard Grant

CAREER: Advancing Mathematical Models and Algorithms for Decentralized Optimization in Complex Multi-agent Networks

职业：推进复杂多智能体网络中分散优化的数学模型和算法

批准号：
1944500
财政年份：
2020
资助金额：
--
项目类别：
Standard Grant

Near-Optimal Scalable Algorithms for Multi-Agent Reinforcement Learning

多智能体强化学习的近乎最优可扩展算法

批准号：
2444539
财政年份：
2020
资助金额：
--
项目类别：
Studentship

NSF-BSF:RI:Small:Collaborative Research:Next-Generation Multi-Agent Path Finding Algorithms

NSF-BSF：RI：小型：协作研究：下一代多智能体路径查找算法

批准号：
1815660
财政年份：
2018
资助金额：
--
项目类别：
Standard Grant

NSF-BSF:RI:Small:Collaborative Research:Next-Generation Multi-Agent Path Finding Algorithms

NSF-BSF：RI：小型：协作研究：下一代多智能体路径查找算法

批准号：
1817189
财政年份：
2018
资助金额：
--
项目类别：
Standard Grant

{{ showInfoDetail.title }}

成果类型：
{{ showInfoTypeEnum[showInfoType] }}

学术检索：
百度学术

作者：{{ showInfoDetail.author }}

知道了