TBCMulti-Agent Reinforcement Learning for Assistive Robots
TBC辅助机器人多智能体强化学习
基本信息
- 批准号:2901369
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2023
- 资助国家:英国
- 起止时间:2023 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project uses reinforcement learning for robotic control to aid disabled humans in various everyday assistive tasks. These assistive tasks include washing, dressing, eating and drinking. The project uses the assistive gym environment, which simulates these tasks to be as close as possible to physically realistic settings (Erickson et al., 2019). The project is particularly challenging as it has a large action space and long sequences of actions. Additionally, the project emphasises human-robot interaction, where the robot needs to learn policies that can satisfy the preferences of humans and anticipate the cooperative behaviour of humans. Currently, the project is replicating and expanding on baseline algorithms used in existing research. In particular, the project will explore the application of decision transformers to the specific environment, an architectural implementation that still needs to be implemented. This is guided by the success of short-term memory architectures that are better at learning sequential dependencies in the environment (Glaese et al., 2022). Transformers are a promising alternative to LSTM, being more efficient at learning long-term dependencies, allowing the robot to choose better action early on in the sequence to improve the entire trajectory. Future work will focus on challenging restrictive assumptions prevalent in past research. In particular, the project will address two assumptions: that humans will optimally cooperate with the robot and that human preferences are given ex-ante and do not dynamically change. To remove these assumptions, the project will implement reinforcement learning from human feedback, accommodating a more complex and diverse set of preferences that need not be predefined. Techniques like inverse reinforcement learning from human data can simulate sub-optimal human cooperation. These enhancements aim to develop algorithms that learn more adept policies for real-world applications.
该项目将强化学习用于机器人控制,以帮助残疾人完成各种日常辅助任务。这些辅助任务包括洗衣、穿衣、吃饭和喝水。该项目使用辅助健身房环境,该环境模拟这些任务尽可能接近物理现实设置(Erickson等人,2019年)。该项目特别具有挑战性,因为它有很大的行动空间和很长的行动序列。此外,该项目强调人机交互,机器人需要学习能够满足人类偏好的策略,并预测人类的合作行为。 目前,该项目正在复制和扩展现有研究中使用的基线算法。特别是,该项目将探索决策转换器在特定环境中的应用,这是一个仍需实现的架构实现。这是由短期记忆体系结构的成功所引导的,短期记忆体系结构更善于学习环境中的顺序依赖性(Glaese et al.,2022年)。Transformer是LSTM的一个很有前途的替代方案,它在学习长期依赖关系方面更有效,允许机器人在序列的早期选择更好的动作,以改善整个轨迹。 未来的工作将侧重于挑战过去研究中普遍存在的限制性假设。特别是,该项目将解决两个假设:人类将与机器人进行最佳合作,以及人类的偏好是事先给定的,不会动态变化。为了消除这些假设,该项目将从人类反馈中实施强化学习,以适应更复杂和多样化的偏好集,这些偏好不需要预先定义。像从人类数据中进行反向强化学习这样的技术可以模拟次优的人类合作。这些增强旨在开发算法,为现实世界的应用程序学习更熟练的策略。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
基于Agent的自动化渗透测试技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
AI Agent赋能中小企业智能决策系统研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
计算机控制Agent在可交互式企业征信报告生成的应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
大模型Agent驱动的AI制药关键技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
混合多元区域情境下多Agent的自主协同决策方法研究
- 批准号:62306099
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于操控员情境意识状态可解释Agent的智能交互触发机制研究
- 批准号:62376220
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于多Agent仿真模型的新能源汽车市场渗透研究
- 批准号:2023JJ60196
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向联排联调的城市复合洪涝灾害风险Agent建模与智能决策
- 批准号:42371092
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
实施科学驱动Agent仿真构建脑卒中患者心理与行为干预规程——基于阶梯式楔形随机对照试验
- 批准号:82260281
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
基于Agent 技术的职业高校校企协同创新主体行为建模研究
- 批准号:2021JJ60029
- 批准年份:2021
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347423 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Optimizing Intelligent Vehicular Routing with Edge Computing through Multi-Agent Reinforcement Learning
通过多智能体强化学习利用边缘计算优化智能车辆路由
- 批准号:
24K14913 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347422 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
- 批准号:
2339112 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
- 批准号:
2312092 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Self-adaptive and Cooperative Multi-agent Reinforcement Learning-based Network Traffic Control
基于强化学习的自适应协作多智能体网络流量控制
- 批准号:
23K19982 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Research Activity Start-up
Partially Observable Multi-agent Inverse Reinforcement Learning
部分可观察多智能体逆强化学习
- 批准号:
2894217 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Studentship
CAREER: Reinforcement Learning-Based Control of Heterogeneous Multi-Agent Systems in Structured Environments: Algorithms and Complexity
职业:结构化环境中异构多智能体系统的基于强化学习的控制:算法和复杂性
- 批准号:
2237830 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
Decentralized Network-wide Signal Control by Multi-Agent Reinforcement Learning
通过多智能体强化学习进行分散式全网络信号控制
- 批准号:
23H01522 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
FMitF: Track I: Safe Multi-Agent Reinforcement Learning with Shielding
FMITF:第一轨:带屏蔽的安全多智能体强化学习
- 批准号:
2319500 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant