強化学習における政策・時空間・ハイパーパラメータの分節化と最適化,その統合
强化学习中策略、时空和超参数的细分、优化和集成
基本信息
- 批准号:22K12182
- 负责人:
- 金额:$ 2.33万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2026-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
深層強化学習において,ハイパーパラメータの設定がどのような影響を与えるかについて実験・検討し,その結果に基づき,異なるハイパーパラメータを持つ複数のニューラルネットワークを並行して学習させ,その都度成績の良いものを採用する手法を開発した.事前実験でハイパーパラメータによっては初期探索速度が速いものや逆に最終的な精度が高いものなどがあることが確認されたため,どのパラメータが一番良いかを選定するのではなくて,並列に学習させ,出力はその都度良いものを選択するという手法を提案した.意外な結果としては,ニューラルネットワークが学習に必要なパラメータ数を持っている場合,ある意味適当に選んだ他のネットワークの出力でもそのネットワークの学習に良い影響を与えることが多いことであった.逆に統計的に学習効率を最大化させようとする手法を用いてネットワークを選択すると全体として探索度合いが高くなってしまうため,最終的な成績は悪いということが分かった.また,強化学習のハイパーパラメータ最適化に向けたアルゴリズム開発では,新しいパラメータを発掘するために,探索領域の拡張を自ら行う手法を検討し,良い精度を出すことを確認した.具体的に,以前提案したアルゴリズムの設定パラメータを削減しつつも良い探索精度を出すことができた.実験では,領域外探索の距離とタイミングについて複数のパターンを調査し,遠くの距離を探索させる頻度は徐々小さくすべきであるということと,探索点群の更新頻度が半分以上の時に遠くの距離を探索させるのか,半分以下の時に探索させるのかで精度の向上に与える質的な違いが明らかになり,それを利用した手法を開発することができた.
Deep reinforcement learning is based on the following three aspects: 1. the setting of the parameter is different from the setting of the parameter; 2. the setting of the parameter is different from the setting of the parameter; 3. the setting of the parameter is different from the setting of the parameter; 4. the setting of the parameter is different from the setting of the parameter; 5. the setting of the parameter is different from the setting. In advance, the speed of initial exploration, the speed of reverse exploration, the final accuracy, the high accuracy, the high accuracy Unexpected results: When learning is necessary, the number of factors is maintained. When learning is necessary, the number of factors means that learning is affected by the number of factors. The method of maximizing the learning rate is to use the method of optimizing the learning rate. In addition, the optimization of reinforcement learning and the development of new methods of exploration and expansion of the field are discussed and the accuracy is confirmed. Specifically, the previous proposal was made to reduce the accuracy of exploration. In fact, the distance of exploration outside the domain is investigated, the frequency of exploration of distance is small, the frequency of exploration of point group is updated more than half a minute, the distance is explored less than half a minute, the accuracy of exploration is upward, and the quality is violated. The first step is to open the door.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Addition of Out-of-Population Search in JADE
JADE 中添加人口外搜索
- DOI:10.3156/jsoft.35.1_532
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:MIYAHIRA Yuichi;IGUCHI Makishi;NOTSU Akira;HONDA Katsuhiro
- 通讯作者:HONDA Katsuhiro
Addition of Out-of-population Search Based on the Rate of Solution Updates in JADE
在 JADE 中添加基于解更新率的人口外搜索
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Y. Miyahira;A. Notsu;K. Honda
- 通讯作者:K. Honda
Deep Reinforcement Learning Combined with Approximation of Number of State Experiences
深度强化学习结合状态经验数近似
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:M. Iguchi;A. Notsu;K. Yasunaga;S. Ubukata;K. Honda
- 通讯作者:K. Honda
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
野津 亮其他文献
fMRIデータのFCM識別器-パラメータの粒子群最適化
fMRI数据的FCM判别器——参数的粒子群优化
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
市橋 秀友;本多 克宏;野津 亮;服部 隆男 - 通讯作者:
服部 隆男
ファジィc平均識別器によるROC分析
使用模糊 C 均值分类器进行 ROC 分析
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
市橋 秀友;太田 圭一;松浦 史明;本多 克宏;野津 亮 - 通讯作者:
野津 亮
fMRIデータによる脳活動のFCM識別器
使用 fMRI 数据进行大脑活动的 FCM 鉴别器
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
市橋 秀友;本多 克宏;野津 亮;服部 隆男;宮本 恵理 - 通讯作者:
宮本 恵理
垂直分割型の分散データベースからの平面状ファジィクラスターの抽出
从垂直分区的分布式数据库中提取平面模糊簇
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
國澤 昂平;本多 克宏;生方 誠希;野津 亮 - 通讯作者:
野津 亮
野津 亮的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('野津 亮', 18)}}的其他基金
看護理論とグループダイナミックスに基づいた共感的メディアの構築
基于护理理论和群体动力学构建共情媒体
- 批准号:
03J05104 - 财政年份:2003
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
意思決定支援のための大規模並列多目的進化計算システムの開発
开发用于决策支持的大规模并行多目标进化计算系统
- 批准号:
24K15119 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アナログ回路に基づく進化計算手法による深層学習モデルの最適化
基于模拟电路的进化计算方法优化深度学习模型
- 批准号:
24K15115 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
解の性能根拠を示す説明可能な進化計算
可解释的进化计算为解决方案提供性能证据
- 批准号:
23K20388 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
多目的進化計算を用いたエージェント群の戦略的意思決定を実現する強化学習
使用多目标进化计算实现一组智能体的战略决策的强化学习
- 批准号:
24K03001 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
解集合アグリゲーションによる多目的進化計算
使用解集聚合的多目标进化计算
- 批准号:
23K24916 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
配分比率決定問題に対する設計変数空間の分割・削減型進化計算
分配比例确定问题的分裂约简设计变量空间演化计算
- 批准号:
24K15113 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
問題設定へのフィードバックで最適化プロセスを支援する進化計算
支持优化过程并反馈问题设置的进化计算
- 批准号:
24K03011 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
多目的進化計算を用いた点と面を巡る複数ドローンの制約を考慮した飛行経路計画
利用多目标进化计算考虑多架无人机围绕点和面的约束的飞行路径规划
- 批准号:
24K15133 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
進化計算と強化学習による適応的な群れの創発モデル
使用进化计算和强化学习的自适应群体涌现模型
- 批准号:
24KJ0753 - 财政年份:2024
- 资助金额:
$ 2.33万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Towards Explainable AI Algorithms via Fitness Landscape Analysis in Evolutionary Computation
通过进化计算中的适应度景观分析实现可解释的人工智能算法
- 批准号:
2890959 - 财政年份:2023
- 资助金额:
$ 2.33万 - 项目类别:
Studentship














{{item.name}}会员




