オンチップ自律学習回路のための価値形成目的型SAM-SNN強化学習の研究
面向价值形成的片上自主学习电路SAM-SNN强化学习研究
基本信息
- 批准号:19K12176
- 负责人:
- 金额:$ 1.25万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
一昨年度末,「目標到達タスク」において初めてSAM-SNNにActor-Critic型強化学習を利用したモデルでの成功を確認した.これに伴い,知財化の実施の検討も併せて行い,初出の技術であることを確認した.しかしながら,その後の解析により学習の経過に伴って目標到達率が再度減少し学習が安定しないことが判明した.これを受けて昨年度は,より解析を行いやすくするため,これまでC/C++言語により実験を行っていたが,python言語により実験システムを実装しなおし,各種パラメータの詳細な動きを観測しやすいように変更を行った.ここで作成したpython言語による実験システムは,本研究室にてSAM-SNNをライブラリ化したものを利用しており,研究の実施に伴って研究環境の整備も進め,技術蓄積を行っている.本研究室の本実験システムの利用により,下記のことが明らかとなってきた.・探索を(カオス的などではなく)ランダムに行っており,このランダム成分のパラメータの設定による学習のされかたに幅がある.・学習率ηの設定は,関数近似のタスクと同様に,小さめが安定している模様.今後上記の検証を重ねていく.また,昨年度は,これまでのSAM-SNNによるActor-Critic型強化学習の研究で得られた知見を国際会議ISNAIH2023にて成果発表を行った.主に国内の同分野の若手研究者と有益なディスカッションが可能となった.
At the end of last year, the success of SAM-SNN Actor-Critic Reinforcement Learning was confirmed. In this case, the implementation of financial management is discussed and implemented, and the initial technology is confirmed. After the analysis, the target arrival rate of learning is reduced again, and the learning is stable. The C/C++ language is the language of choice, and the Python language is the language of choice. This is the first time that SAM-SNN has been developed and utilized in this laboratory. The author of this paper discusses the use of the system in the laboratory. Search for ( The learning rate η is set to be similar to the learning rate η. The learning rate η is set to be similar to the learning rate η. In the future, please remember that the evidence is re-examined. Last year, the SAM-SNN system was developed and the Actor-Critic reinforcement learning was studied. The results of ISNAIH2023 were presented. It is helpful for researchers in the same field in China to find out the possible reasons.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Actor-Critic Reinforcement Learning Using On-Chip Trainable Multilayer SAM Spiking Neural Network
使用片上可训练多层 SAM 尖峰神经网络的 Actor-Critic 强化学习
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Minoru Motoki;Yu Oshiro;Ryuji Waseda;and Terumitsu Nishimuta
- 通讯作者:and Terumitsu Nishimuta
SAMスパイキングニューロンモデルの頻度コーディングにおける基本特性
SAM脉冲神经元模型频率编码的基本特征
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Minoru Motoki;Yu Oshiro;Ryuji Waseda;and Terumitsu Nishimuta;本木 実
- 通讯作者:本木 実
Notthingham Trent University/College of Science and Technology(英国)
诺丁汉特伦特大学/科学技术学院(英国)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
An FPGA Implementation of On-Chip Trainable Multilayer SAM Spiking Neural Network
片上可训练多层 SAM 尖峰神经网络的 FPGA 实现
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Minoru Motoki;Terumitsu Nishimuta;Ryuji Waseda
- 通讯作者:Ryuji Waseda
SAMスパイキングニューラルネットによる関数近似の性能評価
使用 SAM 尖峰神经网络进行函数逼近的性能评估
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Minoru Motoki;Terumitsu Nishimuta;Ryuji Waseda;本木 実,西牟田輝満
- 通讯作者:本木 実,西牟田輝満
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
本木 実其他文献
本木 実的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
- 批准号:
DP240103278 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Discovery Projects
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347423 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Standard Grant
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
- 批准号:
2339794 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Continuing Grant
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
- 批准号:
23K20948 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
- 批准号:
23K21710 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
- 批准号:
23K26216 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
- 批准号:
24KJ2223 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
- 批准号:
24K16865 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
- 批准号:
23K28140 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
- 批准号:
24K20873 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Early-Career Scientists