Towards interactive explanatory reinforcement learning for aligned and trustworthy agents

为一致且值得信赖的代理提供交互式解释性强化学习

基本信息

  • 批准号:
    2314554
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2019
  • 资助国家:
    英国
  • 起止时间:
    2019 至 无数据
  • 项目状态:
    已结题

项目摘要

Deep reinforcement learning (RL) is a compelling solution to complex control problems, but a lack of transparency hampers trust, understanding and safety validation. If RL is to power future autonomous systems, the development of interpretability tools to "open the black box" must become a rigorous science. My research adapts explainable AI (XAI) methods to analyse the behaviour of deep RL agents. In my first year I have used decision trees to "clone" multiagent traffic controllers, revealing the latent factors influencing their outputs. I have since developed a novel tree model for jointly representing the policy, value function and temporal dynamics of a lunar lander, facilitating interactive visualisation and query-answering. While the closed-loop nature of control makes explanation more complex than in supervised learning, the end result may yet be more intuitive, by leveraging human's capacity to adopt Dennett's intentional stance with respect to agents.XAI researchers should always have a target user for their work. In the coming months I intend to focus on one particular user: the designer of the RL agent itself, who is responsible for defining model parameters, and crucially specifying the reward function that drives learning. I plan to use XAI to facilitate interactive RL, in which deeper causal understanding of reward functions and learning dynamics enables the more principled iteration of training, tuning and reward modification, replacing today's trial-and-error approach. This application of XAI addresses the philosophical problem of alignment, which stresses the paramount importance of correct goal specification in the context of increasingly powerful generic optimisers. This research falls within the EPSRC Artificial Intelligence Technologies research area, and also has connections to Human-computer Interaction.
深度强化学习(RL)是解决复杂控制问题的一种令人信服的解决方案,但缺乏透明度会阻碍信任、理解和安全验证。如果RL要为未来的自主系统提供动力,那么开发可解释性工具来“打开黑盒子”必须成为一门严格的科学。我的研究采用可解释AI(XAI)方法来分析深度RL代理的行为。在我的第一年,我已经使用决策树“克隆”多智能体交通控制器,揭示潜在的因素影响他们的输出。从那以后,我开发了一种新的树模型,用于联合表示月球着陆器的政策,价值函数和时间动态,促进交互式可视化和问答。虽然控制的闭环性质使得解释比监督学习更复杂,但最终结果可能更直观,通过利用人类的能力来采用Dennett关于代理的意向立场。XAI研究人员应该始终有一个目标用户。在接下来的几个月里,我打算专注于一个特定的用户:RL代理本身的设计者,他负责定义模型参数,并重要地指定驱动学习的奖励函数。我计划使用XAI来促进交互式RL,其中对奖励函数和学习动态的更深入的因果理解使得训练,调整和奖励修改的迭代更加原则化,取代今天的试错方法。XAI的这种应用解决了对齐的哲学问题,它强调了在日益强大的通用优化器的背景下正确的目标规范的至关重要性。这项研究属于EPSRC人工智能技术研究领域的福尔斯,也与人机交互有关。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似海外基金

LTREB: Collaborative Research: Long-term changes in peatland C fluxes and the interactive role of altered hydrology, vegetation, and redox supply in a changing climate
LTREB:合作研究:泥炭地碳通量的长期变化以及气候变化中水文、植被和氧化还原供应变化的相互作用
  • 批准号:
    2411998
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Smart Cues Toolkit: Supporting Physical Activity at Home with Interactive Contextual Cues
智能提示工具包:通过交互式上下文提示支持家庭体育活动
  • 批准号:
    EP/X036766/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
Development of an Ultra-sensitive Drumhead together with interactive Learning Apps for Electronic Drums.
开发超灵敏鼓皮以及电子鼓的交互式学习应用程序。
  • 批准号:
    10091335
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Utilizing Interactive Videos to Assist Self and Peer Assessment of Students' Speaking
利用互动视频辅助学生口语自评和互评
  • 批准号:
    24K16138
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development and Impact Assessment of an Interactive Online System for Computing Ethics Education
计算机伦理教育交互式在线系统的开发和影响评估
  • 批准号:
    2337132
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
RAPID: Developing an Interactive Dashboard for Collecting and Curating Traffic Data after the March 26, 2024 Francis Scott Key Bridge Collapse
RAPID:开发交互式仪表板,用于收集和管理 2024 年 3 月 26 日 Francis Scott Key 大桥倒塌后的交通数据
  • 批准号:
    2426947
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
I-Corps: Translation potential of using artificial intelligence (AI) for an interactive and inclusive language-learning process designed for young children
I-Corps:使用人工智能 (AI) 为幼儿设计的交互式和包容性语言学习过程的翻译潜力
  • 批准号:
    2418277
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Global Centers Track 2: Equitable and User-Centric Energy Market for Resilient Grid-interactive Communities
全球中心轨道 2:面向弹性电网互动社区的公平且以用户为中心的能源市场
  • 批准号:
    2330504
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
SBIR Phase I: Intelligent Interactive Guidance System for Litigated Insurance Claims
SBIR第一期:保险理赔智能互动引导系统
  • 批准号:
    2329603
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
NSF-BSF: NeTS: Small: Making BGP work for real-time interactive applications
NSF-BSF:NeTS:小型:使 BGP 适用于实时交互式应用程序
  • 批准号:
    2344761
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了