Establishment of Chaos-based Dynamic Reinforcement Learning as Taking an Essential Technology to Realize Emergence of Thinking in Advance
建立基于混沌的动态强化学习作为实现超前思维生成的关键技术
基本信息
- 批准号:20K11993
- 负责人:
- 金额:$ 2.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2021-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
(本研究は、研究代表者の退職に伴う資格喪失のため、やむを得ず1年で廃止となった。この実績は廃止までの1年分のものである)本研究は大きく分けて3つの研究を行った。【1】感度調整学習(SAL)のまとめ 本研究の主題「カオスベースダイナミック強化学習」の基盤となる「感度調整学習(SAS)」について、各ニューロンでの感度調整でネットワーク全体のダイナミクスを調整できることの理論的背景を整理するとともに、カオスダイナミクスの生成および教師あり学習との併用についての系統的なシミュレーションを行い、論文に投稿した。【2】ダイナミック強化学習の基礎研究 強化学習に基づいて各ニューロンで感度を変化させることで、ネットワークダイナミクスを直接学習させるダイナミック強化学習の枠組みで、簡易視覚センサを用いて、エージェントが簡単な物体到達タスクを学習できることを示した。さらに、物体との距離および角度の情報をセンサ入力とした場合でも、同様に学習できた。また、外部入力に対し、フィードバック入力の学習係数を外部入力より小さくした方が性能は良かった。想定していた学習による感度の減少はみられなかった。また、TD誤差が正の際の出力の維持拘束により、この学習係数の差のために感度が増加する場合があることがわかった。【3】ダイナミック教師あり学習の基礎検討 ダイナミクスを直接学習させる考え方を教師あり学習にも導入できるかの基礎検討を行なった。入出力に10ステップの時間差のあるEXOR問題の学習を、誤差の時間平均と現在の誤差との差に基づいて感度を変化させた。(出力ニューロンは通常の誤差勾配で学習) そして、出力ニューロンの学習だけではできなかったものが、この学習を導入することで正しい出力が得られるようになった。感度を通してダイナミクスを直接学習させるという新しい学習の枠組みがある程度動作することが確認できた。
(This study に, the representative of the study <s:1> resigned に accompanied by the loss of う qualification ため ため, やむを ず for 1 year で廃 until となった.) The actual performance of 廃 廃 up to まで <e:1> 1 year is である 廃 である である) this study is <s:1> large <s:1> く けて points けて3 まで <s:1> research を field った. 【 1 】 sensitivity adjustment learning (SAL) の ま と め の this research topic "カ オ ス ベ ー ス ダ イ ナ ミ ッ ク reinforcement learning" の base plate と な る sensitivity adjustment learning (SAS) に つ い て, various ニ ュ ー ロ ン で の sensitivity adjustment で ネ ッ ト ワ ー ク all の ダ イ ナ ミ ク ス を adjustment で き る こ と の theory background を finishing す る と と も に, カ オ ス ダ イ ナ ミ ク ス の generated お よ び teachers あ り learning と の and に つ い て の system な シ ミ ュ レ ー シ ョ ン を い, contribute papers に し た. 【 2 】 ダ イ ナ ミ ッ ク reinforcement learning の reinforcement learning basic research に base づ い て each ニ ュ ー ロ ン で sensitivity を variations change さ せ る こ と で, ネ ッ ト ワ ー ク ダ イ ナ ミ ク ス を directly learning さ せ る ダ イ ナ ミ ッ ク reinforcement learning の 枠 group み で, simple 覚 セ ン サ を with い て, エ ー ジ ェ ン ト が Jane 単 な objects to タ ス ク を learning で き る こ と Youdaoplaceholder0 indicates た. さ ら に, objects と の distance お よ び Angle の intelligence を セ ン サ と into force し た occasions で も, with others in に learning で き た. ま た, external force に し, seaborne フ ィ ー ド バ ッ ク の learning into force coefficient を external よ into force り small さ く し た party が performance good は か っ た. It is determined that <s:1> て た た learn による sensitivity <e:1> to reduce みられな った った. ま た, TD error が is の interstate の output の maintain tight に よ り, こ の poor learning coefficient の の た め に sensitivity が raised plus す る occasions が あ る こ と が わ か っ た. [3] ダ イ ナ ミ ッ ク teachers あ り learning based beg ダ 検 の イ ナ ミ ク ス を directly learning さ せ る exam え party を teachers あ り learning に も import で き る か の base line beg を 検 な っ た. Into the output に 10 ス テ ッ プ の lag の あ る を "problem の learning, error の time average と now の と の poor に base づ い て sensitivity を variations change さ せ た. (output ニ ュ ー ロ ン は の error usually hook with で learning) そ し て, output ニ ュ ー ロ ン の learning だ け で は で き な か っ た も の が, こ の learning を import す る こ と で is し い output が must ら れ る よ う に な っ た. Sensitivity を tong し て ダ イ ナ ミ ク ス を directly learning さ せ る と い う new し い learning の 枠 group み が あ る degree action す る こ と が confirm で き た.
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係
循环网络灵敏度调整学习过程中灵敏度与李雅普诺夫指数的关系
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:江島拓哉;徳丸侑輝;柴田克成
- 通讯作者:柴田克成
Adaptive balancing of exploration and exploitation around the edge of chaos in internal-chaos-based learning
- DOI:10.1016/j.neunet.2020.08.002
- 发表时间:2020-08
- 期刊:
- 影响因子:0
- 作者:Toshitaka Matsuki;K. Shibata
- 通讯作者:Toshitaka Matsuki;K. Shibata
カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響
使用混沌神经网络引入不应性对学习记忆问题的影响
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:黒崎耕平;柴田克成
- 通讯作者:柴田克成
Q-learning with exploration driven by internal dynamics in chaotic neural network
- DOI:10.1109/ijcnn48605.2020.9207114
- 发表时间:2020-07
- 期刊:
- 影响因子:0
- 作者:Toshitaka Matsuki;Souya Inoue;K. Shibata
- 通讯作者:Toshitaka Matsuki;Souya Inoue;K. Shibata
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
柴田 克成其他文献
柴田 克成的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('柴田 克成', 18)}}的其他基金
実ロボットによるDirect-Vision-Based強化学習の検証
使用真实机器人验证基于直接视觉的强化学习
- 批准号:
13780295 - 财政年份:2001
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
センサ信号統合化学習と強化学習の融合に関する研究
传感器信号集成学习与强化学习融合研究
- 批准号:
08233204 - 财政年份:1996
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
評価と動作の並列学習により障害回避を自己形成する自律能動学習機械の研究
通过评估和动作并行学习自我形成避障的自主主动学习机研究
- 批准号:
07780305 - 财政年份:1995
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似国自然基金
化妆品热感原料功效成分的检测和热感度表示研究
- 批准号:2024JJ8239
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
高压液态二氧化碳射流切割高感度固体推进剂的机理与过程安全性研究
- 批准号:22378423
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
强界面—自催化—低感度多功能耦合纳微复合含能微单元组装设计及能量释放特性
- 批准号:22375098
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
飞秒激光微加工引入缺陷调控黑索金激光起爆感度的规律及机理研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
光响应偶氮类配体构筑感度可调含能配合物及性能调变机制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
HMX球形聚集结构的构筑及冲击波感度关联性研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
超含能材料结构、性能和感度的数值模拟研究
- 批准号:
- 批准年份:2020
- 资助金额:62 万元
- 项目类别:面上项目
TATB中氢键网络及π堆积的温度响应与冲击波感度的内禀关系研究
- 批准号:21805260
- 批准年份:2018
- 资助金额:27.5 万元
- 项目类别:青年科学基金项目
低感度有机过氧化物炸药的合成与性能研究
- 批准号:21702194
- 批准年份:2017
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
新型MBNx(M=Li,Na,K;x=2-5)含能材料的高压合成及其机械感度研究
- 批准号:11704355
- 批准年份:2017
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
相似海外基金
ヒトiPS細胞を用いた神経毒性物質の高感度検出システムの開発
利用人类 iPS 细胞开发神经毒性物质的高灵敏度检测系统
- 批准号:
24K13420 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
B型肝炎エリミネーションを目指した高感度B型肝炎コア関連抗原・簡易迅速検査の開発
开发高度敏感的乙型肝炎核心相关抗原/旨在消除乙型肝炎的简单快速检测
- 批准号:
24K13442 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
子宮内病原微生物の高感度PCR検査による早産児の重症化予防方法の確立
利用宫内病原微生物高灵敏 PCR 检测建立预防早产儿严重疾病的方法
- 批准号:
24K12548 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
貪食細胞の超高感度検出に基づく血流感染症の早期診断法の開発
基于吞噬细胞超灵敏检测的血流感染早期诊断方法的建立
- 批准号:
24K11635 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
高周波弾性波動素子における非線形応答の高感度ベクトル測定とその応用
高频弹性波器件非线性响应高灵敏度矢量测量及其应用
- 批准号:
24K07588 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ウイルスの検出感度・特異度が共に優れた糖鎖固定化ポリマー粒子の開発
开发具有优异病毒检测灵敏度和特异性的糖链固定聚合物颗粒
- 批准号:
24K08147 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ハイブリッド炉物理実験施設の実現に向けた感度データベースの開発
开发实现混合反应堆物理实验装置的灵敏度数据库
- 批准号:
24K08301 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
高温超伝導線材の高感度交流損失測定システムの開発
高温超导线材高灵敏度交流损耗测量系统的开发
- 批准号:
24K07435 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
C型ナトリウム利尿ペプチドの超高感度測定に基づく心不全と心線維化の新規診断法開発
基于C型利钠肽超灵敏测量开发心力衰竭和心脏纤维化新诊断方法
- 批准号:
24K11229 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Investigate the feasibility of altering cancer drug sensitivity through modulation of AHR activity
研究通过调节 AHR 活性改变癌症药物敏感性的可行性
- 批准号:
24K10327 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




