Efficient Exploration for Model-Based Reinforcement Learning
基于模型的强化学习的高效探索
基本信息
- 批准号:2744707
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2021
- 资助国家:英国
- 起止时间:2021 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Reinforcement Learning (RL) is a branch of Artificial Intelligence (AI) research that focuses on developing algorithms which enable an agent to learn a certain task in the environment they are placed in, such as maximizing the score in a game. A crucial component of this learning process is for the agent to explore strategies that result in the best possible score. When these agents are not able to explore efficiently, their applicability becomes very limited for many use cases. The proposed study will focus on developing novel approaches that allow RL agents to efficiently perform exploration, using the most promising direction of the sub-field: model-based RL. On successful completion, this study will be of invaluable impact to the gaming industry, as it will allow feasible development of RL systems that can acquire high-level playing skills in many types of games, allowing them to be used as challenging opponents, and for extensive game testing.
强化学习(RL)是人工智能(AI)研究的一个分支,专注于开发算法,使智能体能够在其所处的环境中学习特定任务,例如最大化游戏中的得分。这个学习过程的一个关键组成部分是让代理探索导致最佳得分的策略。当这些代理不能有效地探索时,它们的适用性对于许多用例来说变得非常有限。拟议的研究将集中在开发新的方法,使RL代理有效地执行探索,使用最有前途的方向的子领域:基于模型的RL。成功完成后,这项研究将对游戏行业产生宝贵的影响,因为它将允许RL系统的可行开发,这些系统可以在许多类型的游戏中获得高水平的游戏技能,使它们能够被用作具有挑战性的对手,并进行广泛的游戏测试。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似海外基金
Motor control exploration in adult Fragile X syndrome mouse model
成年脆性 X 综合征小鼠模型的运动控制探索
- 批准号:
486986 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Miscellaneous Programs
Exploration of physics beyond the Standard Model through core-collapse supernovae
通过核心塌陷超新星探索标准模型之外的物理学
- 批准号:
23K13097 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of an ultra-slow muon source using high power DUV laser for the exploration of physics beyond the standard model.
使用高功率 DUV 激光器开发超慢 μ 子源,用于超越标准模型的物理探索。
- 批准号:
23K13131 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Exploration of pathology in Moyamoya disease; co-culture model of vascular endothelial and smooth muscle cells derived from induced pluripotent stem cells
烟雾病病理学探索;
- 批准号:
20K22775 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Research Activity Start-up
A voice-user-interface (VUI) artificial intelligence (AI) model exploration for electric vehicle (EV) charging that is inclusive to those living with disabilities
针对电动汽车 (EV) 充电的语音用户界面 (VUI) 人工智能 (AI) 模型探索,为残疾人士提供包容性
- 批准号:
10087169 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Collaborative R&D
Exploration of the new physics beyond the Standard Model with rare processes of the Higgs boson
利用希格斯玻色子的罕见过程探索标准模型之外的新物理学
- 批准号:
22H04944 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (S)
An artificial neural network model of the exploration-exploitation trade off
探索-利用权衡的人工神经网络模型
- 批准号:
559572-2021 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Postgraduate Scholarships - Doctoral
Mechanistic Exploration of the Factors Underlying Musculoskeletal Degeneration in a Rat Model of Diet-Induced Obesity: Exercise and Diet Interventions
饮食引起的肥胖大鼠模型中肌肉骨骼退化因素的机制探索:运动和饮食干预
- 批准号:
461441 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Operating Grants
Development and Application of a Simplified Biliary Tract Cancer PDOX Mouse Model: Exploration for Ideal Personalized Medicine.
简化胆道癌PDOX小鼠模型的开发和应用:理想个体化医疗的探索。
- 批准号:
22K15538 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
A genetic and exploration model for syenite-hosted scandium mineralisation
正长岩型钪矿化成因与勘探模型
- 批准号:
538926-2019 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Collaborative Research and Development Grants