SHF: Small: Formal Symbolic Reasoning of Deep Reinforcement Learning Systems

SHF:小:深度强化学习系统的形式符号推理

基本信息

  • 批准号:
    2007799
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-06-15 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

Deep reinforcement learning, a type of artificial intelligence, has become pervasive and is being deployed in decision-making systems such as autonomous vehicles. Deep reinforcement learning models are, however, subject to instability in both their training process and their run-time performance. Despite much progress in boosting public trust amid rising concerns about the safety of artificial intelligence, there remain significant challenges to rigorously guarantee the safety of deep reinforcement learning in safety-critical systems. This project integrates a range of symbolic reasoning tasks – rigorous abstraction and verification – enabled by formal-methods technology into reinforcement learning to secure the public's trust in such systems. The project's impact is to establish new paradigms and lay foundations for provably safe deep reinforcement learning that is capable of making trustworthy decisions in complex real-world environments.The project's novelty is to augment the training loop of reinforcement learning with a formal-verification module that reasons about system-level safety properties. First, the project investigates techniques to construct formal and differentiable abstractions of reinforcement-learning agents and environments. By reducing the loss between safety properties and differentiable abstractions using optimization techniques, reinforcement learning can now provide formal assurances of correctness at training time. Second, the project develops environment-modeling and -monitoring algorithms to capture environment conditions at run-time. Reinforcement-learning agents are safely adapted to environment changes guaranteed by formal verification. Moreover, this project provides safety guarantees for vision-based deep-reinforcement-learning systems by encoding each high-dimensional visual input into a symbolic representation that is suitable for formal verification.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度强化学习是一种人工智能,已经变得普遍,并被部署在自动驾驶汽车等决策系统中。然而,深度强化学习模型在训练过程和运行时性能方面都存在不稳定性。尽管在对人工智能安全性的担忧日益加剧的情况下,在提高公众信任方面取得了很大进展,但在安全关键系统中严格保证深度强化学习的安全性仍然存在重大挑战。该项目将一系列符号推理任务(严格的抽象和验证)集成到强化学习中,以确保公众对此类系统的信任。该项目的影响是建立新的范式,为可证明安全的深度强化学习奠定基础,从而能够在复杂的现实环境中做出值得信赖的决策。该项目的新奇在于通过形式验证模块来增强强化学习的训练循环,该模块可以推理系统级的安全属性。首先,该项目研究技术,以构建正式的和可区分的抽象的学习代理和环境。通过使用优化技术减少安全属性和可区分抽象之间的损失,强化学习现在可以在训练时提供正确性的正式保证。其次,该项目开发环境建模和监控算法,以捕获运行时的环境条件。强化学习代理可以安全地适应正式验证保证的环境变化。此外,该项目通过将每个高维视觉输入编码为适合正式验证的符号表示,为基于视觉的深度强化学习系统提供安全保障。该奖项反映了NSF的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Verification-guided Programmatic Controller Synthesis
验证引导的程序控制器综合
Art: Abstraction Refinement-Guided Training for Provably Correct Neural Networks
Programmatic Reinforcement Learning without Oracles
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wenjie Qiu;He Zhu
  • 通讯作者:
    Wenjie Qiu;He Zhu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

He Zhu其他文献

DECA: a novel multi-scale efficient channel attention module for object detection in real-life fire images
DECA:一种新颖的多尺度高效通道注意模块,用于现实火灾图像中的目标检测
  • DOI:
    10.1007/s10489-021-02496-y
  • 发表时间:
    2021-05
  • 期刊:
  • 影响因子:
    5.3
  • 作者:
    Wang Junjie;Yu Jiong;He Zhu
  • 通讯作者:
    He Zhu
A coupled mathematical model and experimental validation of oxygen transport behavior in the electro-slag refining process
电渣精炼过程中氧传输行为的耦合数学模型和实验验证
  • DOI:
    10.1007/s10800-017-1048-3
  • 发表时间:
    2017-02
  • 期刊:
  • 影响因子:
    2.9
  • 作者:
    Wang Qiang;Li Guangqiang;Gao Yunming;He Zhu;Li Baokuan
  • 通讯作者:
    Li Baokuan
Association between Drug Co-use Networks and HIV Infection: A Latent Profile Analysis in Chinese Mainland
毒品共用网络与艾滋病毒感染之间的关联:中国大陆的潜在概况分析
  • DOI:
    10.1016/j.fmre.2021.08.011
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    6.2
  • 作者:
    Bo Zhang;Xiangyu Yan;Yongjie Li;He Zhu;Zuhong Lu;Zhongwei Jia
  • 通讯作者:
    Zhongwei Jia
Why People Leave Their Rural Hometown : Evidence from 8 Provinces in China July 22 , 2018
人们为何离开农村家乡:来自中国8个省份的证据 2018年7月22日
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    He Zhu
  • 通讯作者:
    He Zhu
Temperature and Motion Modules of Automatic Nucleic Acid Extractor
全自动核酸提取仪温度和运动模块

He Zhu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('He Zhu', 18)}}的其他基金

FMitF: Track I: Synthesis and Verification for Programmatic Reinforcement Learning
FMITF:第一轨:程序化强化学习的综合和验证
  • 批准号:
    2124155
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CISE-ANR: SHF: Small: Scenario-based Formal Proofs for Concurrent Software
CISE-ANR:SHF:小型:并发软件的基于场景的形式化证明
  • 批准号:
    2315363
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Little Tricky Logics: Misconceptions in Understanding Logics and Formal Properties
SHF:小:小棘手的逻辑:理解逻辑和形式属性的误解
  • 批准号:
    2227863
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Toward Fully Automated Formal Software Verification
SHF:小型:迈向全自动形式软件验证
  • 批准号:
    2210243
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF CORE: Small: Hybrid NLP and Formal Techniques for Synthesizing Assertions and Identifying Ambiguities from English
SHF CORE:小型:用于综合断言和识别英语歧义的混合 NLP 和形式化技术
  • 批准号:
    2101021
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Formal Verification of SQRT and Divider Circuits
SHF:小:SQRT 和分压器电路的形式验证
  • 批准号:
    2006465
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Scalable Formal Verification of ANN controlled Cyber-Physical Systems
SHF:小型:ANN 控制的网络物理系统的可扩展形式验证
  • 批准号:
    2008957
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Practical and Formal Foundations for Intermittent Computer Systems
SHF:小型:间歇计算机系统的实用和正式基础
  • 批准号:
    2007998
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Formal Methods for Modern System Configuration Languages
SHF:小:现代系统配置语言的形式化方法
  • 批准号:
    1717636
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: Reusable Tools for Formal Modeling of Machine Code
SHF:小型:协作研究:用于机器代码形式化建模的可重用工具
  • 批准号:
    1624125
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Efficient Formal Analysis of Evolving Software Systems
SHF:小型:不断发展的软件系统的高效形式分析
  • 批准号:
    1618132
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了