強化学習にもとづく有限時間整定とフォーメーション制御への応用
基于强化学习的有限时间稳定和编队控制应用
基本信息
- 批准号:22KF0201
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
研究員のこれまでの研究を拡張する方向性として、受入研究者が分布ロバスト最適化、深層学習、最適輸送の3つを提示し、それぞれの基礎理論を教示しつつ、最新の論文を調査するために4ヶ月を費やした。その結果、分布ロバスト制御を取り入れた強化学習に関する研究に焦点を定め、定式化とその可解性を検討してきた。分布ロバスト最適化(DRO)は、不確実性の下で意思決定を行うという課題に取り組む数理最適化の研究分野である。多くの実用的な場面で、意思決定者は、意思決定に影響を与える不確実性を支配する確率分布に関する不完全な情報や曖昧な情報に直面する。DROは、このような不確実性に強い意思決定を最適化するためのフレームワークを提供する。DROでは、可能性のあるすべての不確実性に対応する確率分布の集合に対して意思決定が頑健であることを保証する。この特徴により、DROはサプライチェーンマネジメント、金融、エネルギー、輸送など、幅広い応用先に適用されてきた。こうした活発な研究は、モーメントベースのアプローチ、曖昧性集合、Wassersteinベースのアプローチなど、いくつかの理論的および計算的アプローチの開発につながった。申請者はこうした研究背景を適切に理解しつつ、ネットワーク化制御、強化学習に関連する形でいくつかの定式化をおこなった。残念ながら、事情により滞在は今年度で終了となったが、共同研究を継続するための問題意識の共有はおこなうことができた。
Researcher の こ れ ま で を の research company, zhang す る directional と し て, incoming researchers が ロ バ ス ト optimization, the deep study, the optimal transportation の 3 つ を し, そ れ ぞ れ の を basic theory teaching し つ つ, latest の thesis を survey す る た め に ヶ four months を fee や し た. そ の results, distribution ロ バ ス ト suppression を take り れ た reinforcement learning に masato す に る research focus を め, demean と そ の solvability を beg し 検 て き た. Distribution ロ バ ス ト optimization (droz) は, uncertain be の で meaning decided to line を う と い に う subject group take り む mathematical optimization の research eset で あ る. More く の be は decides with な scenes で, meaning, mean に influence を and え る uncertain be sex を dominate す る probabilistic distribution に masato す る incomplete な や ambiguity な intelligence に face す る. DRO する, <s:1> ような, uncertainty に, strong <s:1> will determination を, optimization するため, フレ, ムワ, ムワ and を provide する. Droz で は, possibility の あ る す べ て の uncertain be sex に 応 seaborne す る collection of probabilistic distribution の に し seaborne て mean decision が robust で あ る こ と を guarantee す る. こ の, 徴 に よ り, droz は サ プ ラ イ チ ェ ー ン マ ネ ジ メ ン ト, finance, エ ネ ル ギ ー, conveying な ど, hiroo picture い 応 with に first apply さ れ て き た. Live こ う し た 発 な research は, モ ー メ ン ト ベ ー ス の ア プ ロ ー チ, vague set, out ベ ー ス の ア プ ロ ー チ な ど, い く つ か の theory お よ び computing ア プ ロ ー チ の open 発 に つ な が っ た. Applicants は こ う し た background を appropriate に understand し つ つ, ネ ッ ト ワ ー ク suppression and reinforcement learning に masato even す る form で い く つ か の demean を お こ な っ た. Remnants read aloud な が ら, things に よ り lag in は "at the end of this year で と な っ た が and common research を 継 続 す る た め の problem consciousness の mutual は お こ な う こ と が で き た.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
加嶋 健司其他文献
Selective Stabilization of Unstable Standing Waves in a Reaction-diffusion System
反应扩散系统中不稳定驻波的选择性稳定
- DOI:
10.9746/sicetr.51.110 - 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
梅津 佑介;小川 知之;加嶋 健司 - 通讯作者:
加嶋 健司
若材齢時に振動を受ける鋼板と超速硬HPFRCCとの付着強度試験方法の提案とエポキシプライマーの粘性の影響
超快硬化HPFRCC与年轻时振动钢板粘合强度测试方法的提出以及环氧底漆粘度的影响
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
梅津 佑介;小川 知之;加嶋 健司;潮俊光;佐伯竜彦;林承燦,大久保仁人,新家一秀,六郷恵哲 - 通讯作者:
林承燦,大久保仁人,新家一秀,六郷恵哲
C-S-Hの性質とコンクリート中の物質移動性状
混凝土中的C-S-H特性和传质特性
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
梅津 佑介;小川 知之;加嶋 健司;潮俊光;佐伯竜彦 - 通讯作者:
佐伯竜彦
加嶋 健司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('加嶋 健司', 18)}}的其他基金
情報の取得を包含した制御理論と統計的学習理論の融合数理基盤
控制理论和统计学习理论的融合,包括信息获取
- 批准号:
21H04875 - 财政年份:2021
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
相似海外基金
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
- 批准号:
23K26216 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習に基づく自己位置推定のための地図および環境の最適化
基于强化学习的自定位地图与环境优化
- 批准号:
24K15136 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層強化学習を用いた加速器高周波電圧パターンの最適化
使用深度强化学习优化加速器高频电压模式
- 批准号:
24K07074 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
EAGER: Exploring Automatic Optimization of Multi-tiered HPC Storage Systems via Practical Reinforcement Learning
EAGER:通过实用强化学习探索多层 HPC 存储系统的自动优化
- 批准号:
2412345 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant
Development of a Structural Optimization Method for the Midship Section of a Ship with Deep Reinforcement Learning AI incorporating Principal Dimensions as Design Variables
利用深度强化学习人工智能(将主尺寸作为设计变量)开发船舶中段结构优化方法
- 批准号:
23K13508 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
深層強化学習による2脚移動ロボット身体に備わる知能の最適化
使用深度强化学习优化双足移动机器人身体的智能
- 批准号:
23K19101 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
モデル予測制御と強化学習を応用したビルエネルギーシステムの運用最適化手法の開発
应用模型预测控制和强化学习开发建筑能源系统运行优化方法
- 批准号:
23KJ0513 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
深層強化学習による視野検査の最適化および堅牢化に関する基礎研究
使用深度强化学习的视野测试优化和鲁棒性基础研究
- 批准号:
23K11322 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
汎化性能を高めた深層強化学習に基づく組合せ最適化法
提高泛化性能的基于深度强化学习的组合优化方法
- 批准号:
23K11263 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CIF: Small: Accelerating Stochastic Approximation for Optimization and Reinforcement Learning
CIF:小型:加速优化和强化学习的随机逼近
- 批准号:
2306023 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant














{{item.name}}会员




