CSR: Small: Collaborative Research: Tuning Extreme-scale Storage Stack through Deep Reinforcement Learning

CSR:小型:协作研究:通过深度强化学习调整超大规模存储堆栈

基本信息

  • 批准号:
    1817094
  • 负责人:
  • 金额:
    $ 24万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Many research domains, such as high-energy physics, climate science, astrophysics, combustion science, and computational biology, need to process large amounts of data. Such domains are heavily relying on the capabilities of high performance computing (HPC) systems to manage and efficiently process massive amounts of data. Consequently, applications in the aforementioned research domains require highly optimized performance on the HPC storage systems that store, manage, and manipulate data. This project aims to utilize deep reinforcement learning methods to fine-tune the HPC storage system for optimized performance.This research explores the feasibility of leveraging deep reinforcement learning to optimize HPC storage systems by: (a) Creating a deep learning based HPC storage stack model; (b) Remodeling existing HPC storage stack to support automated configuration and tuning; (c) Collecting training datasets and training the storage stack model; and (d) utilizing the model as a responsive and playable virtual environment to learn the best policy to tune parameters. As a collaborative project, this research aims to advance the domain knowledge of both HPC storage systems and machine learning. The enhanced performance on the HPC storage stack will in turn benefit scientific discovery and thus our society. The investigators will integrate research, education, and outreach efforts during the course of this project, including recruiting and retaining of underrepresented students, mentoring graduate and undergraduate students, integrating research findings into curriculum, and publishing and disseminating results.The data collected to train the storage stack model will be shared at https://discl.cs.ttu.edu/tuningstorage while the code of machine learning at https://github.com/forrestbao/DL4SC. Results and data will be made available by the time of publication. The data will be annotated as appropriate to facilitate interpretation. The principal investigators will strive to maintain the repositories as long as possible.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
许多研究领域,如高能物理、气候科学、天体物理、燃烧科学和计算生物学,都需要处理大量的数据。这类领域严重依赖高性能计算(HPC)系统的能力来管理和高效处理海量数据。因此,上述研究领域中的应用程序需要在存储、管理和操作数据的HPC存储系统上实现高度优化的性能。本项目旨在利用深度强化学习方法对HPC存储系统进行微调以优化性能。本研究通过以下方式探索利用深度强化学习优化HPC存储系统的可行性:(A)创建基于深度学习的HPC存储堆栈模型;(B)重塑现有HPC存储堆栈以支持自动配置和调整;(C)收集训练数据集并训练存储堆栈模型;以及(D)将该模型用作响应和可玩的虚拟环境,以学习调整参数的最佳策略。作为一个协作性项目,本研究旨在提升高性能计算存储系统和机器学习的领域知识。HPC存储堆栈的增强性能反过来将造福于科学发现,从而造福于我们的社会。研究人员将在这个项目的过程中整合研究、教育和推广工作,包括招募和保留代表性不足的学生,指导研究生和本科生,将研究结果整合到课程中,以及发布和传播结果。为训练存储堆栈模型而收集的数据将在https://discl.cs.ttu.edu/tuningstorage共享,而机器学习的代码将在https://github.com/forrestbao/DL4SC.共享结果和数据将在发布时公布。数据将作适当的注解,以方便解释。首席调查人员将努力尽可能长时间地维护存储库。这一裁决反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Data Distribution for Heterogeneous Storage Systems
  • DOI:
    10.1109/tc.2022.3223302
  • 发表时间:
    2023-06
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Jiang Zhou;Yong Chen;Mai Zheng;Weiping Wang
  • 通讯作者:
    Jiang Zhou;Yong Chen;Mai Zheng;Weiping Wang
Optimal GPU Frequency Selection using Multi-Objective Approaches for HPC Systems
HAM: Hotspot-Aware Manager for Improving Communications With 3D-Stacked Memory
HAM:热点感知管理器,用于改善 3D 堆栈内存的通信
  • DOI:
    10.1109/tc.2021.3066982
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Wang, Xi;Tumeo, Antonino;Leidel, John D.;Li, Jie;Chen, Yong
  • 通讯作者:
    Chen, Yong
JobViewer: Graph-based Visualization for Monitoring High-Performance Computing System
JobViewer:用于监控高性能计算系统的基于图形的可视化
  • DOI:
    10.1109/bdcat56447.2022.00021
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dang, Tommy;Nguyen, Ngan V.T.;Li, Jie;Sill, Alan;Hass, Jon;Chen, Yong
  • 通讯作者:
    Chen, Yong
I/O characteristic discovery for storage system optimizations
  • DOI:
    10.1016/j.jpdc.2020.08.005
  • 发表时间:
    2021-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiang Zhou;Yong Chen;Dong Dai;Zhuang Yu;Weiping Wang
  • 通讯作者:
    Jiang Zhou;Yong Chen;Dong Dai;Zhuang Yu;Weiping Wang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yong Chen其他文献

Can Hedge Funds Time Market Liquidity?
对冲基金可以把握市场流动性吗?
  • DOI:
    10.2139/ssrn.1537925
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Cao;Yong Chen;Bing Liang;A. Lo
  • 通讯作者:
    A. Lo
Some secret sharing algorithms for Multimedia Security
多媒体安全的一些秘密共享算法
Structural and functional studies on SNAREs-mediated membrane fusion
SNARE 介导的膜融合的结构和功能研究
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yong Chen
  • 通讯作者:
    Yong Chen
Phenanthroline Bridged Bis(iβ/i-cyclodextrin)s/Adamantane-carboxylic Acid Supramolecular Complex as an Efficient Fluorescence Sensor to Znsup2+/sup
菲咯啉桥联双(β-环糊精)/金刚烷羧酸超分子复合物作为 Zn2 的高效荧光传感器
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    5.4
  • 作者:
    Yu-Hui Zhang;Ying-Ming Zhang;Yong Chen;Yang Yang;Yu Liu
  • 通讯作者:
    Yu Liu
Developing and evaluating harvest control rules with different biological reference points for the American lobster (Homarus americanus) fishery in the Gulf of Maine
制定和评估缅因湾美洲龙虾(Homarus americanus)渔业不同生物参考点的收获控制规则
  • DOI:
    10.1093/icesjms/fsr071
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Yuying Zhang;Yong Chen;C. Wilson
  • 通讯作者:
    C. Wilson

Yong Chen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yong Chen', 18)}}的其他基金

Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323084
  • 财政年份:
    2024
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Conference: 2024 Manufacturing Science and Engineering Conference and 52nd North American Manufacturing Research Conference; Knoxville, Tennessee; 17-21 June 2024
会议:2024年制造科学与工程会议暨第52届北美制造研究会议;
  • 批准号:
    2344983
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Quantum Many-Body Physics in Spin-Orbit Coupled Bose Gases
自旋轨道耦合玻色气体中的量子多体物理
  • 批准号:
    2012185
  • 财政年份:
    2020
  • 资助金额:
    $ 24万
  • 项目类别:
    Continuing Grant
Phase-II IUCRC Texas Tech University: Center for Cloud and Autonomic Computing
第二阶段 IUCRC 德克萨斯理工大学:云和自主计算中心
  • 批准号:
    1939140
  • 财政年份:
    2020
  • 资助金额:
    $ 24万
  • 项目类别:
    Continuing Grant
Collaborative Research: CESER: EAGER: "FabWave" - A Pilot Manufacturing Cyberinfrastructure for Shareable Access to Information Rich Product Manufacturing Data
合作研究:CESER:EAGER:“FabWave”——用于共享访问信息丰富的产品制造数据的试点制造网络基础设施
  • 批准号:
    1812675
  • 财政年份:
    2018
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Elements:Software:NSCI: Empowering Data-driven Discovery with a Provenance Collection, Management, and Analysis Software Infrastructure
元素:软件:NSCI:通过来源收集、管理和分析软件基础设施支持数据驱动的发现
  • 批准号:
    1835892
  • 财政年份:
    2018
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Collaborative Research: Strain Based Devices for Switches and Memory Applications
合作研究:用于开关和存储器应用的基于应变的器件
  • 批准号:
    1711332
  • 财政年份:
    2017
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: Uncovering Vulnerabilities in Parallel File Systems for Reliable High Performance Computing
SHF:小型:协作研究:发现并行文件系统中的漏洞以实现可靠的高性能计算
  • 批准号:
    1718336
  • 财政年份:
    2017
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Additive Manufacturing of Controlled Anisotropic Materials via Electrically Assisted Nanocomposite Fabrication
通过电辅助纳米复合材料制造受控各向异性材料的增材制造
  • 批准号:
    1663663
  • 财政年份:
    2017
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Dynamics and Excitations of Spin-Orbit-Coupled Bose-Einstein Condensates
自旋轨道耦合玻色-爱因斯坦凝聚体的动力学和激发
  • 批准号:
    1708134
  • 财政年份:
    2017
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CSR: Small: Expediting Continual Online Learning on Edge Platforms through Software-Hardware Co-designs
协作研究:企业社会责任:小型:通过软硬件协同设计加快边缘平台上的持续在线学习
  • 批准号:
    2312157
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Small: Caphammer: A New Security Exploit in Energy Harvesting Systems and its Countermeasures
合作研究:CSR:小型:Caphammer:能量收集系统的新安全漏洞及其对策
  • 批准号:
    2314681
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Small: Cross-layer learning-based Energy-Efficient and Resilient NoC design for Multicore Systems
协作研究:CSR:小型:基于跨层学习的多核系统节能和弹性 NoC 设计
  • 批准号:
    2321224
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Small: Caphammer: A New Security Exploit in Energy Harvesting Systems and its Countermeasures
合作研究:CSR:小型:Caphammer:能量收集系统的新安全漏洞及其对策
  • 批准号:
    2314680
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Small: Cross-layer learning-based Energy-Efficient and Resilient NoC design for Multicore Systems
协作研究:CSR:小型:基于跨层学习的多核系统节能和弹性 NoC 设计
  • 批准号:
    2321225
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Small: Expediting Continual Online Learning on Edge Platforms through Software-Hardware Co-designs
协作研究:企业社会责任:小型:通过软硬件协同设计加快边缘平台上的持续在线学习
  • 批准号:
    2312158
  • 财政年份:
    2023
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Decentralized Real-Time Machine Learning Systems on Near-User Edge Devices
CSR:小型:协作研究:近用户边缘设备上的分散式实时机器学习系统
  • 批准号:
    2104416
  • 财政年份:
    2020
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research:Heterogeneous Ultra Low Power Accelerator for Wearable Biomedical Computing
CSR:小型:协作研究:用于可穿戴生物医学计算的异构超低功耗加速器
  • 批准号:
    2006274
  • 财政年份:
    2019
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Overheard at Home - Mitigating Overhearing of Continuous Listening Devices
CSR:小:协作研究:在家无意中听到的声音 - 减轻连续监听设备的无意中听到的情况
  • 批准号:
    1815274
  • 财政年份:
    2018
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Overheard at Home - Mitigating Overhearing of Continuous Listening Devices
CSR:小:协作研究:在家无意中听到的声音 - 减轻连续监听设备的无意中听到的情况
  • 批准号:
    1816213
  • 财政年份:
    2018
  • 资助金额:
    $ 24万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了