Bayesian Deep Reinforcement Learning
贝叶斯深度强化学习
基本信息
- 批准号:2243850
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2019
- 资助国家:英国
- 起止时间:2019 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Brief description of the context of the research including potential impactDeep reinforcement learning has become ubiquitous for learning control policies in challenging environments such as robotic control, Go-playing and autonomous driving. However, standard approaches are often sample inefficient, unstable, and use ad-hoc tricks that are not theoretically well justified. This project looks at deriving principled new objectives and algorithms for deep reinforcement learning through a Bayesian lens, and new interpretations of existing reinforcement learning algorithms.Aims and Objectives- Extending existing methods in the Bayesian Reinforcement Learning via meta-learning in the Bayes Adaptive MDP Framework to more complex environments.- Studying the connection between deep reinforcement learning and probabilistic inference and using this to derive a principled objective for reinforcement learning. We aim to bring theoretical justification for existing objectives such as mean-squared Bellman error which may not appropriately reflect the geometry of the function space.- Scaling related methodologies such as Bayesian optimisation to novel settings.Novelty of the research methodology- Probabilistic treatment of reinforcement learning- Novel and newly proposed frameworks for reinforcement learning such as BAMDPs and RL as inferenceAlignment to EPSRC's strategies and research areas (which EPSRC research area the project relates to) Further information on the areas can be found on http://www.epsrc.ac.uk/research/ourportfolio/researchareas/- Artificial intelligence technologies- Robotics- Statistics and applied probabilityAny companies or collaborators involvedNone
研究背景的简要描述,包括潜在的影响深度强化学习已经成为无处不在的学习控制策略在具有挑战性的环境,如机器人控制,围棋和自动驾驶。然而,标准的方法通常是样本效率低,不稳定,并使用ad-hoc技巧,理论上没有很好的理由。该项目着眼于通过贝叶斯透镜推导深度强化学习的原则性新目标和算法,以及对现有强化学习算法的新解释。目的和目标-通过贝叶斯自适应MDP框架中的元学习将贝叶斯强化学习中的现有方法扩展到更复杂的环境。研究深度强化学习和概率推理之间的联系,并利用它来推导强化学习的原则目标。我们的目标是为现有的目标,如均方贝尔曼误差,这可能不适当地反映函数空间的几何结构带来理论上的理由。扩展相关的方法,如贝叶斯优化到新的设置。研究方法的新奇-强化学习的概率处理-强化学习的新颖和新提出的框架,如BAMDPs和RL作为推理与EPSRC的战略和研究领域(该项目与EPSRC的研究领域有关)保持一致有关这些领域的更多信息可以在http://www.epsrc.ac.uk/research/ourportfolio/researchareas/-上找到人工智能技术-机器人-统计和应用概率任何参与的公司或合作者无
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
Internet-administered, low-intensity cognitive behavioral therapy for parents of children treated for cancer: A feasibility trial (ENGAGE).
针对癌症儿童父母的互联网管理、低强度认知行为疗法:可行性试验 (ENGAGE)。
- DOI:
10.1002/cam4.5377 - 发表时间:
2023-03 - 期刊:
- 影响因子:4
- 作者:
- 通讯作者:
Differences in child and adolescent exposure to unhealthy food and beverage advertising on television in a self-regulatory environment.
在自我监管的环境中,儿童和青少年在电视上接触不健康食品和饮料广告的情况存在差异。
- DOI:
10.1186/s12889-023-15027-w - 发表时间:
2023-03-23 - 期刊:
- 影响因子:4.5
- 作者:
- 通讯作者:
The association between rheumatoid arthritis and reduced estimated cardiorespiratory fitness is mediated by physical symptoms and negative emotions: a cross-sectional study.
类风湿性关节炎与估计心肺健康降低之间的关联是由身体症状和负面情绪介导的:一项横断面研究。
- DOI:
10.1007/s10067-023-06584-x - 发表时间:
2023-07 - 期刊:
- 影响因子:3.4
- 作者:
- 通讯作者:
ElasticBLAST: accelerating sequence search via cloud computing.
ElasticBLAST:通过云计算加速序列搜索。
- DOI:
10.1186/s12859-023-05245-9 - 发表时间:
2023-03-26 - 期刊:
- 影响因子:3
- 作者:
- 通讯作者:
Amplified EQCM-D detection of extracellular vesicles using 2D gold nanostructured arrays fabricated by block copolymer self-assembly.
使用通过嵌段共聚物自组装制造的 2D 金纳米结构阵列放大 EQCM-D 检测细胞外囊泡。
- DOI:
10.1039/d2nh00424k - 发表时间:
2023-03-27 - 期刊:
- 影响因子:9.7
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
基于Deep Unrolling的高分辨近红外二区荧光分子断层成像方法研究
- 批准号:12271434
- 批准年份:2022
- 资助金额:46 万元
- 项目类别:面上项目
基于深度森林(Deep Forest)模型的表面增强拉曼光谱分析方法研究
- 批准号:2020A151501709
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
面向Deep Web的数据整合关键技术研究
- 批准号:61872168
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于语义计算的海量Deep Web知识探索机制研究
- 批准号:61272411
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Deep Web数据集成查询结果抽取与整合关键技术研究
- 批准号:61100167
- 批准年份:2011
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
面向Deep Web的大规模知识库自动构建方法研究
- 批准号:61170020
- 批准年份:2011
- 资助金额:57.0 万元
- 项目类别:面上项目
Deep Web敏感聚合信息保护方法研究
- 批准号:61003054
- 批准年份:2010
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于逻辑强化学习的Deep Web模式匹配研究
- 批准号:61070122
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
相似海外基金
DeepMARA - Deep Reinforcement Learning based Massive Random Access Toward Massive Machine-to-Machine Communications
DeepMARA - 基于深度强化学习的大规模随机访问实现大规模机器对机器通信
- 批准号:
EP/Y028252/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Fellowship
Feedback Control of Flow Separation around an Airfoil using Deep Reinforcement Learning
使用深度强化学习对机翼周围的流动分离进行反馈控制
- 批准号:
23KJ0866 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
Development of a Structural Optimization Method for the Midship Section of a Ship with Deep Reinforcement Learning AI incorporating Principal Dimensions as Design Variables
利用深度强化学习人工智能(将主尺寸作为设计变量)开发船舶中段结构优化方法
- 批准号:
23K13508 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of Collision Avoidance System for Maritime Autonomous Surface Ship: Imitating and Surpassing Human Experts by Deep Inverse Reinforcement Learning
海上自主水面船舶防撞系统开发:通过深度逆强化学习模仿并超越人类专家
- 批准号:
22KJ2623 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
Developing explainable decision support systems for inventory management using deep reinforcement learning
使用深度强化学习开发可解释的库存管理决策支持系统
- 批准号:
23K13514 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Intelligent and Integrated Control of V2X-Enabled Autonomous Vehicles using Deep Reinforcement Learning
使用深度强化学习对支持 V2X 的自动驾驶车辆进行智能集成控制
- 批准号:
RGPIN-2021-02839 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Deep Bayesian Reinforcement Learning in Changing Environments
不断变化的环境中的深度贝叶斯强化学习
- 批准号:
2724208 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Studentship
Collaborative Research: CIF: Medium: MoDL:Toward a Mathematical Foundation of Deep Reinforcement Learning
合作研究:CIF:媒介:MoDL:迈向深度强化学习的数学基础
- 批准号:
2212263 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
III: Small: Deep Interactive Reinforcement Learning for Self-optimizing Feature Selection
III:小:用于自优化特征选择的深度交互式强化学习
- 批准号:
2152030 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: CIF: Medium: MoDL:Toward a Mathematical Foundation of Deep Reinforcement Learning
合作研究:CIF:媒介:MoDL:迈向深度强化学习的数学基础
- 批准号:
2212262 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant