CRII: RI: Secure Multi-Agent Reinforcement Learning Algorithms

CRII:RI:安全多代理强化学习算法

基本信息

  • 批准号:
    2105007
  • 负责人:
  • 金额:
    $ 17.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-05-15 至 2025-04-30
  • 项目状态:
    未结题

项目摘要

Recent years have witnessed significant advances in reinforcement learning (RL), an area of machine learning that achieved great success in solving various sequential decision-making problems. Advances in single‐agent RL algorithms sparked new interest in multi-agent RL (MARL). The goal of this project is to build robust, secure algorithms for autonomous systems that are built using MARL. The project team will investigate a novel threat that can be exploited simply by designing an adversarial plan for an agent acting in a cooperative multi‐agent environment so as to create natural observations that are adversarial to one or more of its allies. For example, in connected autonomous vehicles, one compromised vehicle candrastically disrupt security, causing confusion and mistakes that result in poor performance and even harm to humans who rely on these systems. The project team will build a robust MARL algorithm to such adversarial manipulations. The educational plan for this project includes developing a suit of tutorials on analyzing the security and robustness of MARL algorithms, designed for use in a graduate course or as a tool for MARL researchers. The project team will also contribute to educational outreach by involving graduate and undergraduate students from underrepresented groups.The project is built upon three overarching objectives (1) study how attackers can exploit MARL vulnerabilities,(2) develop a more robust MARL algorithm by training each agent using the counterfactual reasoning about other agents’ behaviors, and (3) create a novel online formal verification method to satisfy the security and safety requirements during the execution of our proposed MARL algorithm. More specifically, for the first objective, the project team will prove the feasibility of using a compromised agent to attack its allies in MARL systems through its actions. The second objective will reverse‐engineer the attack strategies to develop a robust MARL algorithm that models the agents’ behaviors during training and correlates their actions using counterfactual reasoning. In the third objective, an online formal verification model will be developed to detect any deviations in agents’ behaviors using a predefined set of security and safety specifications.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,强化学习(RL)取得了重大进展,这是机器学习的一个领域,在解决各种顺序决策问题方面取得了巨大成功。单智能体RL算法的进步引发了对多智能体RL(MARL)的新兴趣。该项目的目标是为使用MARL构建的自治系统构建强大,安全的算法。项目团队将调查一种新的威胁,只需为在合作多智能体环境中行动的智能体设计一个对抗计划,就可以利用这种威胁,从而创建对其一个或多个盟友具有对抗性的自然观察。例如,在联网的自动驾驶汽车中,一辆受损的汽车可能会严重破坏安全性,导致混乱和错误,导致性能低下,甚至伤害依赖这些系统的人。项目团队将构建一个强大的MARL算法来应对这种对抗性操作。该项目的教育计划包括开发一套关于分析MARL算法的安全性和鲁棒性的教程,旨在用于研究生课程或作为MARL研究人员的工具。项目团队还将通过让来自代表性不足群体的研究生和本科生参与教育推广活动。该项目建立在三个总体目标之上(1)研究攻击者如何利用MARL漏洞,(2)通过使用关于其他代理行为的反事实推理来训练每个代理,(3)提出了一种新的在线形式化验证方法,以满足MARL算法在执行过程中的安全性要求。更具体地说,对于第一个目标,项目团队将通过其行动证明使用受损代理攻击其在MARL系统中的盟友的可行性。第二个目标将对攻击策略进行逆向工程,以开发一种强大的MARL算法,该算法在训练期间对代理的行为进行建模,并使用反事实推理将其行为关联起来。在第三个目标中,将开发一个在线正式验证模型,以使用一套预定义的安全和安全规范来检测代理行为中的任何偏差。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sarra Alqahtani其他文献

Operation mercury: Impacts of national‐level armed forces intervention and anticorruption strategy on artisanal gold mining and water quality in the Peruvian Amazon
汞行动:国家级武装部队干预和反腐败战略对秘鲁亚马逊手工金矿开采和水质的影响
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    8.5
  • 作者:
    E. Dethier;M. Silman;Luis E. Fernandez;Jorge Caballero Espejo;Sarra Alqahtani;Paúl Pauca;David A. Lutz
  • 通讯作者:
    David A. Lutz

Sarra Alqahtani的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
  • 批准号:
    2025JJ90117
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病 中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
  • 批准号:
    82401112
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
  • 批准号:
    2022J011347
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
  • 批准号:
    2022JJ70115
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

CRII: RI: Deep neural network pruning for fast and reliable visual detection in self-driving vehicles
CRII:RI:深度神经网络修剪,用于自动驾驶车辆中快速可靠的视觉检测
  • 批准号:
    2412285
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
Research Infrastructure: Mid-scale RI-1 (MI:IP): X-rays for Life Sciences, Environmental Sciences, Agriculture, and Plant sciences (XLEAP)
研究基础设施:中型 RI-1 (MI:IP):用于生命科学、环境科学、农业和植物科学的 X 射线 (XLEAP)
  • 批准号:
    2330043
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Cooperative Agreement
NSF Engines Development Award: Accelerating A Just Energy Transition Through Innovative Nature-Inclusive Offshore Wind Farms (CT,DE,MA,MD,NJ,RI,VA)
NSF 发动机开发奖:通过创新的自然包容性海上风电场加速公正的能源转型(康涅狄格州、特拉华州、马里兰州、马里兰州、新泽西州、罗德岛州、弗吉尼亚州)
  • 批准号:
    2315558
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Cooperative Agreement
新しい口腔癌センチネルリンパ節マッピング法の確立-RI法との非劣性試験-
口腔癌前哨淋巴结定位新方法的建立-RI法非劣效性检验-
  • 批准号:
    24K20038
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
RIビームを用いた医療用At-211製造技術の開発
使用 RI 光束开发医用 At-211 制造技术
  • 批准号:
    23K25132
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
医療用RIの大量製造に向けた大強度He二価ECRイオン源の研究開発
医用RI量产用高强度He二价ECR离子源研发
  • 批准号:
    24KJ1107
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Mass measurements of Ag and Pd isotopes with the Rare RI-Ring for the 2nd peak of the r-process abundance
使用 Rare RI 环对 r 过程丰度的第二个峰进行 Ag 和 Pd 同位素的质量测量
  • 批准号:
    23K22509
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
  • 批准号:
    2426592
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
減速RIビームを用いたフェムト・スケール量子系における相転移現象の研究
使用减速 RI 光束研究飞秒级量子系统中的相变现象
  • 批准号:
    24H00239
  • 财政年份:
    2024
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了