Optimizing Fluid Mixing with Reinforcement Learning

通过强化学习优化流体混合

基本信息

项目摘要

流体混合は多種多様な工学応用上で重要であるにも関わらず,古くから試行錯誤やノウハウに頼っている部分が多く, 数理的に最適化されているとは言い難い.一方,強化学習は時間大域的な最適化問題に有効であり,近年著しく発展しているが,その応用は未だ限定的である.そこで本研究では,流体混合の問題が時間大域的な問題であることに注目し,強化学習を用いて流体混合を最適化する手法を確立した.具体的には,対象とする流体混合の問題設定を定式化し,流体混合最適化のための深層強化学習(Deep Q-Network)プログラムを実装,ベンチマーク問題に対して最適化を行い有効性を示した.また,強化学習によって得られた最適混合操作が物理的にも理に適っていることを見出した.また,濃度場の時間発展に拡散の効果も取り入れた場合(有限のペクレ数)についても強化学習による最適化を行った.その結果,高ペクレ数で学習を行った結果(Deep Q-Network)は低ペクレ数の場合にも転用可能であること,その逆は必ずしも有効でない(転用可能でない)ことを明らかにした.このことは将来的に強化学習を混合問題へ適用する際に重要な設計指針となり得る.この転用可能性については(当初の計画にはなかった)転移学習の研究成果から派生したものであり,転移学習法についての結果を含め国際学術誌や学会にて成果発表を行った.最終的な総合報告として,2022年にScientific Reports誌に成果を掲載し,さらにEurekAlert!等を通して研究の成果や重要性について分かりやすく発表した.
Fluid mixing は many many others な で important engineering 応 used で あ る に も masato わ ら ず, ancient く か ら pilot error や ノ ウ ハ ウ に 頼 っ て い る part が く more, the mathematical optimal に さ れ て い る と は い い difficult. Side, reinforcement learning は time big domain に な optimization problems of the unseen で あ り, in recent years the し く 発 exhibition し て い る が, そ の 応 use は だ yet qualified で あ る. そ こ で this study で は, fluid mixing の な が big time domain problems で あ る こ と に attention し, reinforcement learning を with い て optimal fluid mixing を す る gimmick を establish し た. Specific に は, like と seaborne す る fluid mixing の problem set を demean し, fluid mixing optimization の た め の Deep reinforcement learning (Deep Q - Network) プ ロ グ ラ ム を be installed, ベ ン チ マ ー ク problem に し seaborne て line optimization を い have sharper sex を shown し た. ま た, reinforcement learning に よ っ て have ら れ た optimal mixed operation が physical に も Richard に optimum っ て い る こ と を shows し た. ま た, concentration field の time 発 exhibition に company, scattered の unseen fruit も take り れ た occasions (limited の ペ ク レ) に つ い て も reinforcement learning に よ る line optimization を っ た. そ の results, high ペ ク レ line number で learning を っ た results (Deep Q - Network) low は ペ ク レ number の occasions に も planning with possible で あ る こ と, そ の inverse は will ず し も have sharper で な い (planning may で な い) こ と を Ming ら か に し た. こ の こ と は future に reinforcement learning mixed problem へ を す る interstate に important な design pointer と な り る. こ の planning with possibility に つ い て は (の original plan に は な か っ た) move planning study の research か ら derived し た も の で あ り, planning to move learning method に つ い て を の results contain め international society for academic ambition や に 発 table line を っ て results た. Final な総 combined report と て て 2022 にScientific Reports に results を revealed と, さらにEurekAlert! The を is based on the research results of て through て, the significance of や に て て て, the points of やすく やすく, and the manifestations of た.

项目成果

期刊论文数量(19)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Reservoir Computing - theory, applications, and physical implementations -
油藏计算 - 理论、应用和物理实现 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信
  • 通讯作者:
    犬伏正信
機械学習を用いた2次元角柱後流の乱流場推定
使用机器学习对二维棱柱尾流进行湍流场估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yoshinori Shimizu;Yuka Funahashi;Hayato Hanazono and Shogo Murata;Yoshitaka Saiki;犬伏正信;M. Inubushi;犬伏正信;犬伏 正信,中谷謙介,本告遊太郎,後藤晋
  • 通讯作者:
    犬伏 正信,中谷謙介,本告遊太郎,後藤晋
リザーバコンピューティング -力学系を用いた機械学習の数理と応用-
油藏计算-使用动力系统的机器学习的数学和应用-
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信
  • 通讯作者:
    犬伏正信
リザバーコンピューティングを用いた乱流の状態推定
使用储层计算进行湍流状态估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fujiwara Kazumasa;Ikeda Masahiro;Wakasugi Yuta;Yushi Nakano;犬伏正信,中谷謙介,後藤晋
  • 通讯作者:
    犬伏正信,中谷謙介,後藤晋
3次元周期箱乱流における同期現象と軌道不安定性
三维周期盒湍流中的同步现象和轨道不稳定性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信;後藤晋;日野圭子・平林真伊・舟橋友香・康孝民;宮本雅彦;犬伏 正信,後藤晋
  • 通讯作者:
    犬伏 正信,後藤晋
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

犬伏 正信其他文献

半導体レーザを搭載した光集積回路によるリザーバコンピューティング実験
半导体激光器光集成电路储层计算实验
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高野 耕輔;菅野 千紘;内田 淳史;犬伏 正信;吉村 和之
  • 通讯作者:
    吉村 和之
短距離フィードバックを有する半導体レーザにおけるリザーバコンピューティングの数値計算
短程反馈半导体激光器储层计算的数值计算
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    菅野 千紘;高野 耕輔;内田 淳史;犬伏 正信;吉村 和之
  • 通讯作者:
    吉村 和之
戻り光を有する半導体レーザを用いた光リザーバコンピューティングによる転移学習
使用带有返回光的半导体激光器进行光储层计算的迁移学习
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒巻 里衣;菅野 円隆;犬伏 正信;内田 淳史
  • 通讯作者:
    内田 淳史
レーザーアブレーションによる半導体結晶球の合成と制御
激光烧蚀半导体晶球的合成与控制
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    富山 真;鈴木 頌允;内田 淳史;吉村 和之;新井 賢一;犬伏 正信;中村 大輔,田崎 涼平,脇山 祐一朗,東畠 三洋,池上 浩
  • 通讯作者:
    中村 大輔,田崎 涼平,脇山 祐一朗,東畠 三洋,池上 浩
光リザーバコンピューティングにおける転移学習を用いたレーザのダイナミクスの推測
在光储层计算中使用迁移学习推断激光动力学
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒巻 里衣;菅野 円隆;犬伏 正信;内田 淳史
  • 通讯作者:
    内田 淳史

犬伏 正信的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('犬伏 正信', 18)}}的其他基金

不安定性に着目した流体力学系の分解とデータ駆動型手法への応用
水动力系统的分解,重点关注不稳定性和数据驱动方法的应用
  • 批准号:
    22K03420
  • 财政年份:
    2022
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コルモゴロフ流の共変リャプノフ解析
科尔莫哥洛夫流的协变李雅普诺夫分析
  • 批准号:
    12J03995
  • 财政年份:
    2012
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347423
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Standard Grant
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
  • 批准号:
    24KJ2223
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
  • 批准号:
    2339794
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Continuing Grant
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
  • 批准号:
    DP240103278
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Discovery Projects
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
  • 批准号:
    24K16865
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
  • 批准号:
    24K20873
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
  • 批准号:
    23K20948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
  • 批准号:
    23K21710
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
  • 批准号:
    23K28140
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
  • 批准号:
    23K26216
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了