Optimizing Fluid Mixing with Reinforcement Learning

通过强化学习优化流体混合

基本信息

项目摘要

流体混合は多種多様な工学応用上で重要であるにも関わらず,古くから試行錯誤やノウハウに頼っている部分が多く, 数理的に最適化されているとは言い難い.一方,強化学習は時間大域的な最適化問題に有効であり,近年著しく発展しているが,その応用は未だ限定的である.そこで本研究では,流体混合の問題が時間大域的な問題であることに注目し,強化学習を用いて流体混合を最適化する手法を確立した.具体的には,対象とする流体混合の問題設定を定式化し,流体混合最適化のための深層強化学習(Deep Q-Network)プログラムを実装,ベンチマーク問題に対して最適化を行い有効性を示した.また,強化学習によって得られた最適混合操作が物理的にも理に適っていることを見出した.また,濃度場の時間発展に拡散の効果も取り入れた場合(有限のペクレ数)についても強化学習による最適化を行った.その結果,高ペクレ数で学習を行った結果(Deep Q-Network)は低ペクレ数の場合にも転用可能であること,その逆は必ずしも有効でない(転用可能でない)ことを明らかにした.このことは将来的に強化学習を混合問題へ適用する際に重要な設計指針となり得る.この転用可能性については(当初の計画にはなかった)転移学習の研究成果から派生したものであり,転移学習法についての結果を含め国際学術誌や学会にて成果発表を行った.最終的な総合報告として,2022年にScientific Reports誌に成果を掲載し,さらにEurekAlert!等を通して研究の成果や重要性について分かりやすく発表した.
尽管流体混合对于各种工程应用很重要,但长期以来,它一直依赖于反复试验和专业知识,因此很难说它是数学优化的。另一方面,增强学习对于全球时间优化问题有效,并且近年来已经显着开发,但其应用仍然有限。因此,在这项研究中,我们专注于流体混合作为时间全球问题的问题,并建立了一种使用增强学习来优化流体混合的方法。具体而言,制定了目标流体混合问题的设定,并实施了深入的增强学习(深Q-NETWORK)程序以进行流体混合优化,并在基准问题上进行了优化,以证明其有效性。我们还发现,通过增强学习获得的最佳混合操作在物理上是合理的。此外,当扩散效果还纳入浓度场的时间演变(有限的小脚孔数)时,还可以使用加固学习进行了优化。结果,据透露,即使在山核桃数量低的情况下,也可以重新使用高针cle数(深Q网络)的学习结果,反之亦然,不一定是有效的(不重新使用)。这可能是强化学习混合问题的未来应用的重要设计指南。重新利用的这种可能性来自转移学习的研究结果(不是在原始计划中),并且在国际学术期刊和学术会议中提出了结果,包括转移学习方法的结果。作为最终的综合报告,结果发表在2022年的《科学报告》杂志上,研究的结果和重要性通过Eurekalert易于理解!和其他出版物。

项目成果

期刊论文数量(19)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
機械学習を用いた2次元角柱後流の乱流場推定
使用机器学习对二维棱柱尾流进行湍流场估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yoshinori Shimizu;Yuka Funahashi;Hayato Hanazono and Shogo Murata;Yoshitaka Saiki;犬伏正信;M. Inubushi;犬伏正信;犬伏 正信,中谷謙介,本告遊太郎,後藤晋
  • 通讯作者:
    犬伏 正信,中谷謙介,本告遊太郎,後藤晋
Reservoir Computing - theory, applications, and physical implementations -
油藏计算 - 理论、应用和物理实现 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信
  • 通讯作者:
    犬伏正信
リザーバコンピューティング -力学系を用いた機械学習の数理と応用-
油藏计算-使用动力系统的机器学习的数学和应用-
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信
  • 通讯作者:
    犬伏正信
リザバーコンピューティングを用いた乱流の状態推定
使用储层计算进行湍流状态估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fujiwara Kazumasa;Ikeda Masahiro;Wakasugi Yuta;Yushi Nakano;犬伏正信,中谷謙介,後藤晋
  • 通讯作者:
    犬伏正信,中谷謙介,後藤晋
3次元周期箱乱流における同期現象と軌道不安定性
三维周期盒湍流中的同步现象和轨道不稳定性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    犬伏正信;後藤晋;日野圭子・平林真伊・舟橋友香・康孝民;宮本雅彦;犬伏 正信,後藤晋
  • 通讯作者:
    犬伏 正信,後藤晋
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

犬伏 正信其他文献

半導体レーザを搭載した光集積回路によるリザーバコンピューティング実験
半导体激光器光集成电路储层计算实验
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高野 耕輔;菅野 千紘;内田 淳史;犬伏 正信;吉村 和之
  • 通讯作者:
    吉村 和之
戻り光を有する半導体レーザを用いた光リザーバコンピューティングによる転移学習
使用带有返回光的半导体激光器进行光储层计算的迁移学习
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒巻 里衣;菅野 円隆;犬伏 正信;内田 淳史
  • 通讯作者:
    内田 淳史
短距離フィードバックを有する半導体レーザにおけるリザーバコンピューティングの数値計算
短程反馈半导体激光器储层计算的数值计算
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    菅野 千紘;高野 耕輔;内田 淳史;犬伏 正信;吉村 和之
  • 通讯作者:
    吉村 和之
レーザーアブレーションによる半導体結晶球の合成と制御
激光烧蚀半导体晶球的合成与控制
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    富山 真;鈴木 頌允;内田 淳史;吉村 和之;新井 賢一;犬伏 正信;中村 大輔,田崎 涼平,脇山 祐一朗,東畠 三洋,池上 浩
  • 通讯作者:
    中村 大輔,田崎 涼平,脇山 祐一朗,東畠 三洋,池上 浩
光リザーバコンピューティングにおける転移学習を用いたレーザのダイナミクスの推測
在光储层计算中使用迁移学习推断激光动力学
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒巻 里衣;菅野 円隆;犬伏 正信;内田 淳史
  • 通讯作者:
    内田 淳史

犬伏 正信的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('犬伏 正信', 18)}}的其他基金

不安定性に着目した流体力学系の分解とデータ駆動型手法への応用
水动力系统的分解,重点关注不稳定性和数据驱动方法的应用
  • 批准号:
    22K03420
  • 财政年份:
    2022
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コルモゴロフ流の共変リャプノフ解析
科尔莫哥洛夫流的协变李雅普诺夫分析
  • 批准号:
    12J03995
  • 财政年份:
    2012
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
  • 批准号:
    24KJ2223
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
学習領域の翻訳的研究:その橋頭保としてのパラメトリックな強化効果の実験的検討
学习领域的转化研究:作为桥头堡保护的参数强化效应的实验研究
  • 批准号:
    24K06625
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
  • 批准号:
    24K16865
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
  • 批准号:
    24K20873
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
  • 批准号:
    23K20948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了