Collaborative Research: Fast reinforcement learning using multiple models and state decompositions for apllications to Plug-in Hybrid Vehicles

协作研究:使用多个模型和状态分解的快速强化学习在插电式混合动力汽车中的应用

基本信息

  • 批准号:
    1408279
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-08-15 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

Learning schemes in general, are known for their slow convergence rates. The proposal suggests various modifications for improving the speed of learning. The first is the use of multiple models which has proved very effective in other areas of systems theory. A second modification is the use of decentralized or partially decentralized multi-agent state decomposition approaches. Both of the above will make learning schemes in general and reinforcement schemes in particular fast converging and applicable to a wide class of real-world problems. The proposed research will develop the foundations of fast reinforcement learning using these two broad approaches, and will also apply these methods to the optimal control of a fleet of Plug-in Hybrid Electric Vehicles. The outcome of this research will have a societal impact for optimally controlling a fleet of Plug-in Hybrid Electric Vehicles for energy efficiency. The application of the proposed research will have extended application in other areas of systems theory such as neurobiology. Graduate and undergraduate students will be trained in learning schemes for multidisciplinary applications. Cross-fertilization of ideas will be facilitated through a bi-annual workshop on adaptive and learning systems and by leveraging a multidisciplinary Institute for Mathematical Modeling and Computational Science (iMMCS).The proposal focuses on improving convergence speed of learning schemes in multiple agents in order to overcome the limitations of dimensionality, as well as in situations where infrequent communication exists between agents. Innovation is in the use of multiple models and state decomposition to speed up the learning and convergence. The technical approach lies in using multiple identification models; reinforcement learning by using decentralized or partially decentralized multi-agent state decomposition approaches; and evaluating fast reinforcement learning in an application test-bed for controlling a fleet of Plug-in Hybrid Electric Vehicles (PHEVs). The Research Team further plans to quantify the trade-off between learning speed and quality of the "learned solutions".
一般来说,学习方案以其缓慢的收敛速度而闻名。 该提案提出了各种修改,以提高学习速度。第一个是使用多模型,这在系统理论的其他领域已经证明是非常有效的。第二个修改是使用分散或部分分散的多智能体状态分解方法。 上述两种方法都将使学习方案特别是强化方案快速收敛,并适用于广泛的现实问题。拟议的研究将使用这两种广泛的方法开发快速强化学习的基础,并将这些方法应用于插电式混合动力电动汽车车队的最佳控制。这项研究的结果将对优化控制插电式混合动力电动汽车的能源效率产生社会影响。这项研究的应用将扩展到系统理论的其他领域,如神经生物学。研究生和本科生将接受多学科应用学习计划的培训。 通过一年两次的自适应和学习系统研讨会,并利用多学科的数学建模和计算科学研究所(iMMCS),将促进思想的相互交流。该提案的重点是提高多个智能体中学习方案的收敛速度,以克服维度的限制,以及智能体之间存在不频繁通信的情况。 创新之处在于采用多模型和状态分解来加速学习和收敛。技术方法在于使用多个识别模型;通过使用分散或部分分散的多智能体状态分解方法进行强化学习;以及在用于控制插电式混合动力电动汽车(PHEV)车队的应用测试台中评估快速强化学习。 研究小组进一步计划量化学习速度和“学习解决方案”质量之间的权衡。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kumpati Narendra其他文献

Kumpati Narendra的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kumpati Narendra', 18)}}的其他基金

Collaborative Research: Mutual Learning: A Systems Theoretic Investigation
协作研究:相互学习:系统理论研究
  • 批准号:
    1930601
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
How to adapt efficiently using distributed resources and multiple models to time varing dynamic systems
如何使用分布式资源和多个模型有效地适应时变动态系统
  • 批准号:
    1503751
  • 财政年份:
    2015
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Control Based on the Use of Collective Information from Multiple Models
基于使用多个模型的集体信息的自适应控制
  • 批准号:
    1102178
  • 财政年份:
    2011
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Control of Time-Varying Systems Using Multiple Models
使用多个模型的时变系统的自适应控制
  • 批准号:
    0824118
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Control of Time-Varying Systems Using Multiple Models
使用多个模型的时变系统的自适应控制
  • 批准号:
    0601618
  • 财政年份:
    2006
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Stability of Switched Dynamical Systems
切换动力系统的稳定性
  • 批准号:
    0400306
  • 财政年份:
    2004
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Identification and Control of Dynamical Systems Using Neural Networks
使用神经网络的动态系统的自适应识别和控制
  • 批准号:
    0113239
  • 财政年份:
    2001
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Identification and Control of Dynamical Systems Using Neural Networks
使用神经网络的动态系统的自适应识别和控制
  • 批准号:
    9811390
  • 财政年份:
    1998
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Adaptive Identification and Control of Dynamical Systems Using Neural Networks
使用神经网络的动态系统的自适应识别和控制
  • 批准号:
    9521405
  • 财政年份:
    1995
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Adaptive Identification and Control of Dynamical Systems Using Neural Networks
使用神经网络的动态系统的自适应识别和控制
  • 批准号:
    9203928
  • 财政年份:
    1992
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402283
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402284
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: Equipment: MRI Consortium: Track 2 Development of a Next Generation Fast Neutron Detector
合作研究:设备:MRI 联盟:下一代快中子探测器的 Track 2 开发
  • 批准号:
    2320407
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Equipment: MRI Consortium: Track 2 Development of a Next Generation Fast Neutron Detector
合作研究:设备:MRI 联盟:下一代快中子探测器的 Track 2 开发
  • 批准号:
    2320405
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: ATD: Fast Algorithms and Novel Continuous-depth Graph Neural Networks for Threat Detection
合作研究:ATD:用于威胁检测的快速算法和新颖的连续深度图神经网络
  • 批准号:
    2219956
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Disentangling runoff- and Terminus-driven Velocity Variations of Fast Flowing Outlet Glaciers
合作研究:解开快速流动的出口冰川径流和终点驱动的速度变化
  • 批准号:
    2234731
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Equipment: MRI Consortium: Track 2 Development of a Next Generation Fast Neutron Detector
合作研究:设备:MRI 联盟:下一代快中子探测器的 Track 2 开发
  • 批准号:
    2320404
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: ATD: Fast Algorithms and Novel Continuous-depth Graph Neural Networks for Threat Detection
合作研究:ATD:用于威胁检测的快速算法和新颖的连续深度图神经网络
  • 批准号:
    2219904
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Integrated Experiments and Modeling for Spatial, Finite, and Fast Rheometry of Graded Hydrogels using Inertial Cavitation
合作研究:利用惯性空化对梯度水凝胶进行空间、有限和快速流变测量的综合实验和建模
  • 批准号:
    2232426
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Equipment: MRI Consortium: Track 2 Development of a Next Generation Fast Neutron Detector
合作研究:设备:MRI 联盟:下一代快中子探测器的 Track 2 开发
  • 批准号:
    2320400
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了