CAREER: Temporal Causal Reinforcement Learning and Control for Autonomous and Swarm Cyber-Physical Systems

职业:自治和群体网络物理系统的时间因果强化学习和控制

基本信息

  • 批准号:
    2339774
  • 负责人:
  • 金额:
    $ 54.98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2024
  • 资助国家:
    美国
  • 起止时间:
    2024-03-01 至 2029-02-28
  • 项目状态:
    未结题

项目摘要

Understanding the root cause of behavior is imperative for informed decision-making and preventing ineffective or biased policies. Currently, most AI-based learning and control modules embedded in cyber-physical systems (CPS) rely on statistical correlation rather than causality for decision-making. This not only results in incorrect decisions but also hinders the interpretability of learning, limiting transferability and scalability. This CAREER proposal aims to bridge the gap between causal inference and the growing capabilities of reinforcement learning (RL) in CPS. The proposed methods are transformative to a wide range of CPS applications, enabling more efficient and effective decision-making processes in autonomous and swarm CPS such as self-driving cars, drones, industrial robots, and swarm robots.This NSF CAREER proposal proposes a set of temporal causal RL and control approaches for CPS by leveraging the reasoning capabilities of temporal logics and causal diagrams in single-agent, multi-agent, and swarm system settings. The tools we develop will be implemented on multiple CPS testbeds and integrated with the proposed education plan. The proposed algorithms have the following unique and innovative features. Firstly, we will develop computationally efficient tools that can discover temporal causal knowledge from both observational and interventional data of a CPS in performing RL to improve the sampling efficiency and transferability. Secondly, we will develop multi-agent RL approaches for CPS in cooperative, non-cooperative, and incomplete information stochastic game environments where temporal causal knowledge is discovered in a distributed way for expediting RL. Lastly, we will develop scalable RL-based control methods for swarm systems utilizing temporal causal reasoning over agent-level features and swarm-level features such as densities and generalized moments. The education plan will impact the next generation of CPS and AI engineers and researchers through AI-assisted adaptive and interactive teaching, temporal-logic-based educational games, online interactive educational website design for temporal causal RL, and workshops and webinars with industrial partners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
了解行为的根本原因对于明智的决策和防止无效或有偏见的政策至关重要。目前,大多数嵌入在网络物理系统(CPS)中的基于人工智能的学习和控制模块依赖于统计相关性而不是因果关系来进行决策。这不仅会导致错误的决策,而且会阻碍学习的可解释性,限制可移植性和可扩展性。这个CAREER提案旨在弥合CPS中因果推理和不断增长的强化学习(RL)能力之间的差距。所提出的方法对广泛的CPS应用具有变革性,使自主和群体CPS(如自动驾驶汽车、无人机、工业机器人和群体机器人)中的决策过程更加高效和有效。NSF CAREER提案通过利用单智能体、多智能体、和蜂群系统设置我们开发的工具将在多个CPS测试平台上实施,并与拟议的教育计划相结合。所提出的算法具有以下独特和创新的功能。首先,我们将开发计算效率高的工具,可以发现时间因果知识从观察和干预数据的CPS在执行RL,以提高采样效率和可移植性。其次,我们将开发多代理RL方法CPS合作,非合作,和不完全信息的随机博弈环境中的时间因果知识被发现在一个分布式的方式加快RL。最后,我们将开发可扩展的基于RL的控制方法的群体系统,利用时间因果推理代理级功能和群体级功能,如密度和广义矩。该教育计划将通过AI辅助的自适应和交互式教学,基于时间逻辑的教育游戏,时间因果RL的在线交互式教育网站设计,该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响进行评估,被认为值得支持审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Zhe Xu其他文献

Resilient Distributed Hypothesis Testing with Time-Varying Network Topology
具有时变网络拓扑的弹性分布式假设检验
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bo Wu;Steven Carr;Suda Bharadwaj;Zhe Xu;U. Topcu
  • 通讯作者:
    U. Topcu
An electrochemical and Raman spectroscopic study on involvement of La3+ ions in lactate dehydrogenase catalysis
La3离子参与乳酸脱氢酶催化的电化学和拉曼光谱研究
  • DOI:
  • 发表时间:
    1998
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xunqing Wang;Zhe Xu;Xiao
  • 通讯作者:
    Xiao
A Novel MALDI Matrix for Analyzing Peptides and Proteins: Paraffin Wax Immobilized Matrix†
用于分析肽和蛋白质的新型 MALDI 基质:石蜡固定基质†
  • DOI:
    10.1002/cjoc.200990000
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    5.4
  • 作者:
    Yuanlong Wei;Y. Mei;Zhe Xu;Cuihong Wang;Yinlong Guo;Yiping Du;Wei
  • 通讯作者:
    Wei
Hierarchical Control for Head-to-Head Autonomous Racing
面对面自动赛车的分层控制
  • DOI:
    10.55417/fr.2024002
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rishabh Saumil Thakkar;Aryaman Singh Samyal;David Fridovich;Zhe Xu;U. Topcu
  • 通讯作者:
    U. Topcu
Inefficiency analysis of the scheduling game on limited identical machines with activation costs
有限同机上具有激活成本的调度博弈无效率分析
  • DOI:
    10.1016/j.ipl.2015.10.006
  • 发表时间:
    2016-04
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    Fang Xie;Yuzhong Zhang;Qingguo Bai;Zhe Xu
  • 通讯作者:
    Zhe Xu

Zhe Xu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Zhe Xu', 18)}}的其他基金

CPS: Small: Neuro-Symbolic Learning and Control with High-Level Knowledge Inference
CPS:小型:具有高级知识推理的神经符号学习和控制
  • 批准号:
    2304863
  • 财政年份:
    2023
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Standard Grant

相似国自然基金

时间依赖性药物暴露治疗效应异质性的因果推断方法研究
  • 批准号:
    82304245
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于生物标志物时间序列数据的时间因果网络学习及统计推断
  • 批准号:
    12201511
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
发掘时间序列之间动态变化的因果关系
  • 批准号:
    2022J01656
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
高频时序生态系统通量之间因果关系的多时间尺度检测与量化
  • 批准号:
    42107487
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于交叉频率耦合的大脑跨区域因果信息传递研究
  • 批准号:
    62001026
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
非平稳时间序列的频域因果关系检验理论及其应用研究
  • 批准号:
    71963015
  • 批准年份:
    2019
  • 资助金额:
    28.0 万元
  • 项目类别:
    地区科学基金项目
欧亚大陆冬季气温年代际变化归因及其驱动机制研究
  • 批准号:
    41975082
  • 批准年份:
    2019
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目
基于时间序列的因果推断及其在故障溯源中的应用
  • 批准号:
    61873142
  • 批准年份:
    2018
  • 资助金额:
    67.0 万元
  • 项目类别:
    面上项目
复杂系统的高维混沌时间序列分析与预测研究
  • 批准号:
    61773087
  • 批准年份:
    2017
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
函数型数据的检验问题
  • 批准号:
    11671268
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目

相似海外基金

Temporal Causal Pattern Mining From Heterogeneous Event Sequences for Predictive Analytics
从异构事件序列中挖掘时间因果模式以进行预测分析
  • 批准号:
    RGPIN-2018-04403
  • 财政年份:
    2022
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Discovery Grants Program - Individual
Temporal Causal Pattern Mining From Heterogeneous Event Sequences for Predictive Analytics
从异构事件序列中挖掘时间因果模式以进行预测分析
  • 批准号:
    RGPIN-2018-04403
  • 财政年份:
    2021
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Discovery Grants Program - Individual
ATD: Collaborative Research: Causal Inference with Spatio-Temporal Data on Human Dynamics in Conflict Settings
ATD:协作研究:利用时空数据对冲突环境下的人类动态进行因果推断
  • 批准号:
    2124124
  • 财政年份:
    2021
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Standard Grant
ATD: Collaborative Research: Causal Inference with Spatio-Temporal Data on Human Dynamics in Conflict Settings
ATD:协作研究:利用时空数据对冲突环境下的人类动态进行因果推断
  • 批准号:
    2124463
  • 财政年份:
    2021
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Standard Grant
ATD: Collaborative Research: Causal Inference with Spatio-Temporal Data on Human Dynamics in Conflict Settings
ATD:协作研究:利用时空数据对冲突环境下的人类动态进行因果推断
  • 批准号:
    2124323
  • 财政年份:
    2021
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Standard Grant
Corticostriatal mechanisms of causal inference and temporal credit assignment.
因果推理和时间信用分配的皮质纹状体机制。
  • 批准号:
    10700738
  • 财政年份:
    2020
  • 资助金额:
    $ 54.98万
  • 项目类别:
Understanding the Mind and Temporal Causal Representations of Autism Spectrum Disorders - Scripts and Meta-representations
了解自闭症谱系障碍的心灵和时间因果表征 - 脚本和元表征
  • 批准号:
    20K03024
  • 财政年份:
    2020
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Corticostriatal mechanisms of causal inference and temporal credit assignment.
因果推理和时间信用分配的皮质纹状体机制。
  • 批准号:
    10053605
  • 财政年份:
    2020
  • 资助金额:
    $ 54.98万
  • 项目类别:
Temporal Causal Pattern Mining From Heterogeneous Event Sequences for Predictive Analytics
从异构事件序列中挖掘时间因果模式以进行预测分析
  • 批准号:
    RGPIN-2018-04403
  • 财政年份:
    2020
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Discovery Grants Program - Individual
Temporal Causal Pattern Mining From Heterogeneous Event Sequences for Predictive Analytics
从异构事件序列中挖掘时间因果模式以进行预测分析
  • 批准号:
    RGPIN-2018-04403
  • 财政年份:
    2019
  • 资助金额:
    $ 54.98万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了