Digital twin of a supercomputer for operation monitoring and automation

用于操作监控和自动化的超级计算机的数字孪生

基本信息

  • 批准号:
    22K19764
  • 负责人:
  • 金额:
    $ 4.08万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-06-30 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究では、実運用システムのジョブスケジューラを忠実に模擬するデジタルツインを開発する。ジョブスケジューリングを模擬するシミュレータはすでに多数開発されているが、デジタルツインと呼べるほどには実運用システムの挙動と一致しないことが事前の検討で分かっている。このため、令和4年度は影響が大きい要因を明確化し、実運用スーパーコンピュータにおけるジョブスケジューリングをより忠実に再現することを目標として取り組んだ。その結果として、東北大学のスーパーコンピュータAOBAで実際に行われた既知のジョブスケジューリングとできるだけ一致するジョブスケジューリングシミュレータを開発した。また、強化学習によって電力制御に関するジョブスケジューラのパラメータを自動調整する研究や、AOBAで実運用されているリアルタイム津波浸水被害推計システムを想定して、津波シミュレーションの緊急実行の効率化のためのジョブスケジューリング手法を検討した。リアルタイムシミュレーションに必要な計算資源量を予測して動的に割り当てるジョブスケジューリング手法も提案し、その有用性を示すことができた。これらはより複雑なジョブスケジューリングが求められる場合を想定した研究開発であり、ジョブスケジューラやそのシミュレータの現在の機能と限界、および将来の開発の方向性を明確化することができた。さらには、来年度以降の研究内容の予備調査として、ジョブスケジューリングに機械学習技術を導入する際に課題となる学習データ不足を、敵対的生成ネットワーク(Generative Adversarial Network, GAN)を用いたデータ拡張により解消する研究も先行して行っている。実データのみを学習データとして利用する場合と比較して、拡張データを用いることで機械学習モデルによる要求資源量予測の精度が向上することが示されている。
在这项研究中,我们将开发一个数字双胞胎,该数字双胞胎忠实地模拟了现实世界系统的工作调度程序。尽管已经开发了许多模拟作业计划的模拟器,但已经发现,实际系统的行为与数字双胞胎的行为不符。因此,在2022年,目标是阐明具有重大影响的因素,并更忠实地重现实用超级计算机的工作时间表。结果,我们开发了一个工作模拟器,该模拟器在Toohoku University的超级计算机AOBA中与尽可能多的已知工作计划匹配。此外,我们还研究了一项研究,以自动调整有关使用强化学习的有关功率控制的工作调度程序的参数,以及一种考虑实际由AOBA操作的实时海啸洪水损害估计系统,以提高海啸模拟紧急执行的工作调度方法。我们还提出了一种工作调度方法,该方法可以预测并动态地分配实时仿真所需的计算资源量,并证明其有用性。这些是用于更复杂的工作计划的研究和发展,并能够阐明工作调度程序及其模拟器的当前功能和局限性以及未来发展的方向。此外,作为对明年研究内容的初步调查,我们正在进行研究以解决学习数据的短缺,这是通过使用敌对生成网络(GAN)扩展的数据扩展将机器学习技术引入工作计划的挑战。与仅将实际数据用作培训数据的情况相比,已经表明,使用扩展数据提高了使用机器学习模型预测所需资源数量的准确性。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Universitas Gadjah Mada(インドネシア)
加札马达大学(印度尼西亚)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
機械学習に基づくジョブスケジューリングのためのGANによるデータ拡張
使用 GAN 进行数据增强,用于基于机器学习的作业调度
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石井翔;髙橋慧智;下村陽一;滝沢寛之
  • 通讯作者:
    滝沢寛之
University of Edinburgh(英国)
爱丁堡大学(英国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Towards Priority-Flexible Task Mapping for Heterogeneous Multi-core NUMA Systems
面向异构多核 NUMA 系统的优先级灵活的任务映射
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yifan Jin;Mulya Agung;Keichi Takahashi;Yoichi Shimomura;and Hiroyuki Takizawa
  • 通讯作者:
    and Hiroyuki Takizawa
ジョブスケジューリングのデジタルツイン化と自動チューニング
作业调度的数字孪生和自动调整
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中井大貴;大村竜義;髙橋慧智;下村陽一;滝沢寛之;滝沢寛之
  • 通讯作者:
    滝沢寛之
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

滝沢 寛之其他文献

ソフトウェア自動チューニング
软件自动调谐
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今村 俊幸;荻田 武史;尾崎 克久;片桐 孝洋;須田 礼仁;高橋 大介;滝沢 寛之;中島 研吾
  • 通讯作者:
    中島 研吾
ベクトル型メディアプロセッサの低消費電力化に関する研究
降低矢量媒体处理器功耗的研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 渉;高 也;佐藤 雅之;江川 隆輔;滝沢 寛之;小林 広明
  • 通讯作者:
    小林 広明
SAR画像を用いた3次元計測の高精度化に関する検討
提高SAR图像三维测量精度的研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 知洋;佐野 健太郎;土方 康平;滝沢 寛之;相澤清晴;Insfran Karl
  • 通讯作者:
    Insfran Karl
Food x IT マルチメディア食事記録
Food x IT 多媒体用餐记录
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 知洋;佐野 健太郎;土方 康平;滝沢 寛之;相澤清晴
  • 通讯作者:
    相澤清晴
キャッシュメモリにおけるスレッド間共有データの管理に関する研究
高速缓冲存储器中线程间共享数据的管理研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西村 秦;佐藤 雅之;江川 隆輔;滝沢 寛之;小林 広明
  • 通讯作者:
    小林 広明

滝沢 寛之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('滝沢 寛之', 18)}}的其他基金

ワークフローエンジンとの連携に基づく臨機応変なジョブスケジューリングの実現
基于与工作流引擎协同的灵活作业调度的实现
  • 批准号:
    24K02945
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
多次元時系列データマイニングのためのクラスタリング手法とその並列化
多维时间序列数据挖掘的聚类方法及其并行化
  • 批准号:
    15700124
  • 财政年份:
    2003
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

Planning: Artificial Intelligence Assisted High-Performance Parallel Computing for Power System Optimization
规划:人工智能辅助高性能并行计算电力系统优化
  • 批准号:
    2414141
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Standard Grant
The Kelvin Living Lab: Towards Net Zero High-Performance Computing
开尔文生活实验室:迈向净零高性能计算
  • 批准号:
    EP/Z531054/1
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Research Grant
CC* CIRA: High-performance computing solutions for small Midwest institutions
CC* CIRA:面向中西部小型机构的高性能计算解决方案
  • 批准号:
    2346616
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Standard Grant
MRI: Track 1 Acquisition of a High-Performance Computing System at New Mexico Tech
MRI:新墨西哥理工学院高性能计算系统的第一轨道采购
  • 批准号:
    2320162
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC: Core: Harvesting Idle Resources Safely and Timely for Large-scale AI Applications in High-Performance Computing Systems
合作研究:OAC:核心:安全及时地收集闲置资源,用于高性能计算系统中的大规模人工智能应用
  • 批准号:
    2403399
  • 财政年份:
    2024
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了