An Explanation-based Reinforcement Learning Approach
基于解释的强化学习方法
基本信息
- 批准号:2169184
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2019
- 资助国家:英国
- 起止时间:2019 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project proposes a novel reinforcement learning (RL) algorithm which is guided by a knowledge-based user feedback. The project integrates user feedback using structured knowledge bases into the traditional RL models. The main objective of the project is to reduce the barriers for a continuous, knowledge-driven dialogue between end-users and RL models, improving few-shot learning capabilities (the ability to generalize from fewer examples).The core research questions are:- Can a Knowledge Base driven reinforcement learning (RL) approach supported by end-user feedback deliver few-shot learning capabilities?- Which Knowledge Representation models and formalisms can support generalization and user feedback process?- How semantic parsing methods can be used to support the end-user interaction with the knowledge base?The research can impact the ability to deliver Artificial Intelligence (AI) systems which are more transparent, and which generalize from fewer examples. These two properties are at the center of the requirements for the application of AI within scenarios which require trust (e.g. health and legal domains).This research is positioned within the EPSRC `data to knowledge' priority area.
该项目提出了一种新的强化学习(RL)算法,该算法由基于知识的用户反馈指导。该项目使用结构化知识库将用户反馈集成到传统的RL模型中。该项目的主要目标是减少终端用户和强化学习模型之间持续的知识驱动对话的障碍,提高少数学习能力(从更少的例子中概括的能力)。核心研究问题是:-由终端用户反馈支持的知识库驱动的强化学习(RL)方法能否提供少数学习能力?-哪些知识表示模型和形式主义可以支持泛化和用户反馈过程?如何使用语义解析方法来支持最终用户与知识库的交互?这项研究可以影响提供更透明的人工智能(AI)系统的能力,并且可以从更少的例子中进行概括。这两个属性是在需要信任的情况下(例如健康和法律的领域)应用AI的要求的中心。这项研究位于EPSRC“数据到知识”的优先领域。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Incentive and governance schenism study of corporate green washing behavior in China: Based on an integiated view of econfiguration of environmental authority and decoupling logic
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
- 批准号:W2433169
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
- 批准号:52301178
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
NbZrTi基多主元合金中化学不均匀性对辐照行为的影响研究
- 批准号:12305290
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
眼表菌群影响糖尿病患者干眼发生的人群流行病学研究
- 批准号:82371110
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
镍基UNS N10003合金辐照位错环演化机制及其对力学性能的影响研究
- 批准号:12375280
- 批准年份:2023
- 资助金额:53.00 万元
- 项目类别:面上项目
CuAgSe基热电材料的结构特性与构效关系研究
- 批准号:22375214
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
A study on prototype flexible multifunctional graphene foam-based sensing grid (柔性多功能石墨烯泡沫传感网格原型研究)
- 批准号:
- 批准年份:2020
- 资助金额:20 万元
- 项目类别:
基于大数据定量研究城市化对中国季节性流感传播的影响及其机理
- 批准号:82003509
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似海外基金
DeepMARA - Deep Reinforcement Learning based Massive Random Access Toward Massive Machine-to-Machine Communications
DeepMARA - 基于深度强化学习的大规模随机访问实现大规模机器对机器通信
- 批准号:
EP/Y028252/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Fellowship
CPS: Small: NSF-DST: Safety-Aware Behaviour-Driven Reinforcement Learning Based Autonomous Driving Solution for Urban Areas
CPS:小型:NSF-DST:基于安全意识行为驱动的强化学习的城市自动驾驶解决方案
- 批准号:
2343167 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Transformer-based Framework for Multi-objective Reinforcement Learning using Hierarchical Policies
使用分层策略的基于 Transformer 的多目标强化学习框架
- 批准号:
24K20843 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Robust and Efficient Model-based Reinforcement Learning
稳健高效的基于模型的强化学习
- 批准号:
EP/X03917X/1 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Research Grant
SLES: CRASH - Challenging Reinforcement-learning based Adversarial scenarios for Safety Hardening
SLES:CRASH - 挑战基于强化学习的安全强化对抗场景
- 批准号:
2331904 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Self-adaptive and Cooperative Multi-agent Reinforcement Learning-based Network Traffic Control
基于强化学习的自适应协作多智能体网络流量控制
- 批准号:
23K19982 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Research Activity Start-up
CAREER: Reinforcement Learning-Based Control of Heterogeneous Multi-Agent Systems in Structured Environments: Algorithms and Complexity
职业:结构化环境中异构多智能体系统的基于强化学习的控制:算法和复杂性
- 批准号:
2237830 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
An Abstraction-based Technique for Safe Reinforcement Learning
一种基于抽象的安全强化学习技术
- 批准号:
EP/X015823/1 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Research Grant
Cultural Pride Reinforcement for Early School Readiness: Pilot Randomized Controlled Trial of a Clinic-Based Intervention for Young African American Children
强化文化自豪感,为早期入学做好准备:对非裔美国幼儿进行临床干预的随机对照试验
- 批准号:
10664763 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Model-based Optimization and Reinforcement Learning with Applications to Nuclear Fusion Research
基于模型的优化和强化学习及其在核聚变研究中的应用
- 批准号:
2871389 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Studentship