Swarm Reinforcement Learning Methods Based on PSO for Complicated Learning Problems

基于PSO的群体强化学习方法解决复杂学习问题

基本信息

  • 批准号:
    22500131
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2010
  • 资助国家:
    日本
  • 起止时间:
    2010 至 2012
  • 项目状态:
    已结题

项目摘要

We proposed swarm reinforcement learning methods based on particle swarm optimization (PSO) for acquiring optimal policies rapidly, and applied the proposed methods to some complicated reinforcement learning problems such as ones with continuous state-action space. In the proposed method, multiple sets of an agent and an environment, which are called learning worlds, are prepared, and agents in each learning world learn not only by individually using a usual reinforcement learning method but also through exchanging information among the learning worlds by using the update equations of PSO.
提出了一种基于粒子群优化(PSO)的群体强化学习方法,用于快速获取最优策略,并将该方法应用于状态-动作空间连续的复杂强化学习问题。在该方法中,准备了多组智能体和环境,称为学习世界,每个学习世界中的智能体不仅通过通常的强化学习方法进行单独学习,而且通过使用粒子群算法的更新方程在学习世界之间进行信息交换。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Swarm Reinforcement Learning Method Based on an Actor-Critic
基于Actor-Critic的群体强化学习方法
Swarm Reinforcement Learning Method Based on an Actor-Critic Method
基于Actor-Critic方法的群体强化学习方法
Swarm Reinforcement Learning Method Based on Ant Colony Optimization
基于蚁群优化的群体强化学习方法
Particle Swarm Optimization に基づくタイルコーディングを用いた強化学習法
基于粒子群优化的瓦片编码强化学习方法
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野中尋史;酒井浩之;増山繁;伊藤 洋
  • 通讯作者:
    伊藤 洋
優越関係を用いたすべてのパレート最適方策を同時に獲得する多目的強化学習法
一种利用优势关系同时获得所有帕累托最优策略的多目标强化学习方法。
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Robin Swezey;Shun Shiramatsu;Tadachika Ozono and Toramatsu Shintani;向井悠祐
  • 通讯作者:
    向井悠祐
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

IIMA Hitoshi其他文献

IIMA Hitoshi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('IIMA Hitoshi', 18)}}的其他基金

Combinatorial Optimizer Based on Deep Reinforcement Learning
基于深度强化学习的组合优化器
  • 批准号:
    20K11988
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似国自然基金

基于GAN-PSO智能算法的高性能Mg-Mn系变形镁合金设计
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
面向多任务优化的信息筛选PSO算法及其层次涌现行为研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于PSO 演化合作博弈的电池组均衡及其系统实现
  • 批准号:
    61671194
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于PSO和NN的隧道照明节能方法研究
  • 批准号:
    61463015
  • 批准年份:
    2014
  • 资助金额:
    46.0 万元
  • 项目类别:
    地区科学基金项目
PSO-PIST方法和程序的发展及应用
  • 批准号:
    21173232
  • 批准年份:
    2011
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
基于PSO-SVM模型软岩动压巷道围岩变形预测与控制机理研究
  • 批准号:
    51104057
  • 批准年份:
    2011
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
基于PSO和HOLON的多品种小批量生产物流瓶颈建模及其智能控制研究
  • 批准号:
    70971118
  • 批准年份:
    2009
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
银屑病抗原Pso p27启动进行期银屑病发病及清热凉血解毒法干预
  • 批准号:
    30873333
  • 批准年份:
    2008
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目

相似海外基金

A Study of Multi-Robot Control System with Mobile Agents Based on PSO
基于PSO的移动Agent多机器人控制系统研究
  • 批准号:
    17K01304
  • 财政年份:
    2017
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Research on High-Speed Embedded DSP based on PSO
基于PSO的高速嵌入式DSP研究
  • 批准号:
    26280017
  • 财政年份:
    2014
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Theoretical analysis of canonical deterministic PSO and the development of itsapplications
典型确定性粒子群算法的理论分析及其应用进展
  • 批准号:
    22560389
  • 财政年份:
    2010
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of A Traffic Forecast System Based on LOM and Proposed Optimal Routing Method with PSO
基于 LOM 的交通预测系统的开发和提出的 PSO 最优路径方法
  • 批准号:
    21760407
  • 财政年份:
    2009
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
PSO ACTUARIAL RATE MODEL FOR MEDICARE RISK CONTRACTS
医疗保险风险合同的 PSO 精算率模型
  • 批准号:
    2002245
  • 财政年份:
    1997
  • 资助金额:
    $ 2.75万
  • 项目类别:
Treatment & Pathogenesis of Skin Cancer, Disorders of Cornification & Pso
治疗
  • 批准号:
    6100537
  • 财政年份:
  • 资助金额:
    $ 2.75万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了