SPX: Collaborative Research: Cross-stack Memory Optimizations for Boosting I/O Performance of Deep Learning HPC Applications

SPX:协作研究:用于提升深度学习 HPC 应用程序 I/O 性能的跨堆栈内存优化

基本信息

  • 批准号:
    2318628
  • 负责人:
  • 金额:
    $ 32.06万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

New computing applications are emerging in smart networks, scientific explorations, business management, security, and healthcare. These applications depend on very large amounts of data. This data must be used in a fast and efficient manner. The use of large supercomputers to analyze such data is on the rise. The techniques they use are referred to as deep learning (DL) high-performance computing (HPC). Researchers are using DL HPC to make sense of this flood of data and obtain useful information. To do this they must redesign HPC systems. A key challenge is how to use resources such as data storage and computer memory at a huge scale. This project will build Metis, a high-performance data storage system that uses new, end-to-end, hardware-supported memory and storage design to meet the needs of DL HPC applications. The goal is to satisfy the challenge posed by increasing data management performance for next-generation supercomputers. The project will connect several different computing communities and increase interactions among them. The project includes educational and engagement activities which will greatly increase the community's understanding of HPC systems. These activities include broadening participation activities to attract and retain new students. Special emphasis will be given to students from underrepresented groups. The project will encourage student interest in design and research in large-scale computing systems design.This project brings together researchers in micro-architecture, distributed computing systems, namely cloud and HPC systems, storage systems, and power/energy modeling to boost DL HPC data processing performance. The research will yield a fundamentally new software-hardware co-designed memory compression technique that transparently compresses DL application memories with negligible runtime performance overhead. Metis will leverage the novel compression substrate to enable a distributed, intelligent, operating-system-level data cache that effectively exploits the physical memory freed via program-memory compression. The developed techniques will open doors for innovative HPC and scientific applications in a broad range of disciplines, which have not been previously possible. Metis' focus on addressing the challenges of increasing performance in the Exascale era, along with engaging researchers from multiple areas, aligns it very well with the goals and objectives of the SPX program. Additionally, the research will also create new knowledge on design principles of memory compression, and yield insights to provide seamless integration of DL applications into the next-generation DL-aware supercomputer infrastructure.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
新的计算应用程序正在智能网络,科学探索,业务管理,安全和医疗保健中出现。这些应用程序取决于大量数据。这些数据必须以快速有效的方式使用。使用大型超级计算机来分析此类数据正在上升。它们使用的技术称为深度学习(DL)高性能计算(HPC)。研究人员正在使用DL HPC来理解这一数据泛滥并获得有用的信息。为此,它们必须重新设计HPC系统。一个关键的挑战是如何使用大规模使用数据存储和计算机存储器之类的资源。该项目将构建METIS,这是一种高性能数据存储系统,该系统使用新的,端到端的,硬件支持的内存和存储设计来满足DL HPC应用程序的需求。目的是通过提高下一代超级计算机的数据管理绩效来满足挑战。该项目将连接几个不同的计算社区并增加它们之间的互动。该项目包括教育和参与活动,这些活动将大大提高社区对HPC系统的理解。这些活动包括扩大参与活动以吸引和留住新学生。来自代表性不足的团体的学生将特别重视。该项目将鼓励学生对大规模计算系统设计的设计和研究的兴趣。本项目将微观架构,分布式计算系统的研究人员汇集在一起​​,即云和HPC系统,存储系统以及功率/能量建模,以提高DL HPC数据处理性能。这项研究将产生一种新的软件硬件共同设计的内存压缩技术,该技术可以透明地压缩DL应用程序记忆,并用可忽略不计的运行时性能开销。 METIS将利用新颖的压缩基板来启用分布式,智能,操作系统级的数据缓存,该数据缓存有效利用通过程序 - 记忆压缩释放的物理内存。开发的技术将在广泛的学科中为创新的HPC和科学应用打开大门,这是不可能的。梅蒂斯(Metis)专注于解决Exascale时代提高绩效的挑战,以及来自多个领域的研究人员,它与SPX计划的目标和目标非常一致。此外,这项研究还将创建有关记忆压缩设计原理的新知识,并产生见解,以将DL应用程序无缝整合到下一代DL-WAWARE SUPERCOUTATER基础架构中。该奖项反映了NSF的法定任务,并通过使用基金会的知识优点和广泛的影响来通过评估来进行评估,并认为有价值。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SHADE: Enable Fundamental Cacheability for Distributed Deep Learning Training
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Redwan Ibne Seraj Khan;Ahmad Hossein Yazdani;Yuqi Fu;Arnab K. Paul;Bo Ji;Xun Jian;Yue Cheng;A. R. Butt
  • 通讯作者:
    Redwan Ibne Seraj Khan;Ahmad Hossein Yazdani;Yuqi Fu;Arnab K. Paul;Bo Ji;Xun Jian;Yue Cheng;A. R. Butt
InfiniStore: Elastic Serverless Cloud Storage
InfiniStore:弹性无服务器云存储
  • DOI:
    10.14778/3587136.3587139
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Zhang, Jingyuan;Wang, Ao;Ma, Xiaolong;Carver, Benjamin;Newman, Nicholas John;Anwar, Ali;Rupprecht, Lukas;Tarasov, Vasily;Skourtis, Dimitrios;Yan, Feng
  • 通讯作者:
    Yan, Feng
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yue Cheng其他文献

CpG island methylator phenotype association with elevated serum alpha-fetoprotein level in hepatocellular carcinoma.
CpG 岛甲基化表型与肝细胞癌血清甲胎蛋白水平升高相关。
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    11.5
  • 作者:
    Changsong Zhang;Zhengyou Li;Yue Cheng;Fengqi Jia;Rong Li;Mengchao Wu;Ke Li;Lixin Wei
  • 通讯作者:
    Lixin Wei
Calibration of reduced-order model for a coupled Burgers equations based on PC-EnKF
基于PC-EnKF的耦合Burgers方程降阶模型标定
Resources utilization, taxation and green education: A path to sustainable power generation
资源利用、税收和绿色教育:可持续发电之路
  • DOI:
    10.1016/j.resourpol.2023.104389
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    10.2
  • 作者:
    Yue Cheng;Gongyan Zhao;Wentao Meng;Qianrong Wang
  • 通讯作者:
    Qianrong Wang
[Study on the Hemoglobin levels among the Tibetan pregnant women in rural Lhasa].
拉萨农村藏族孕妇血红蛋白水平研究[J].
Chromosome 13q12 region critical for the viability and growth of nasopharyngeal carcinoma hybrids
染色体 13q12 区域对于鼻咽癌杂交体的生存和生长至关重要
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    Yue Cheng;H. Lung;P. S. Wong;Da Cheng Hao;Chim Shek Man;E. Stanbridge;M. Lung
  • 通讯作者:
    M. Lung

Yue Cheng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yue Cheng', 18)}}的其他基金

Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403313
  • 财政年份:
    2024
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
CAREER: Harnessing Serverless Functions to Build Highly Elastic Cloud Storage Infrastructure
职业:利用无服务器功能构建高弹性的云存储基础设施
  • 批准号:
    2322860
  • 财政年份:
    2022
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Continuing Grant
CAREER: Harnessing Serverless Functions to Build Highly Elastic Cloud Storage Infrastructure
职业:利用无服务器功能构建高弹性的云存储基础设施
  • 批准号:
    2045680
  • 财政年份:
    2021
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Continuing Grant
SPX: Collaborative Research: Cross-stack Memory Optimizations for Boosting I/O Performance of Deep Learning HPC Applications
SPX:协作研究:用于提升深度学习 HPC 应用程序 I/O 性能的跨堆栈内存优化
  • 批准号:
    1919075
  • 财政年份:
    2019
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant

相似国自然基金

数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
  • 批准号:
    82372548
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

SPX: Collaborative Research: Automated Synthesis of Extreme-Scale Computing Systems Using Non-Volatile Memory
SPX:协作研究:使用非易失性存储器自动合成超大规模计算系统
  • 批准号:
    2408925
  • 财政年份:
    2023
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Scalable Neural Network Paradigms to Address Variability in Emerging Device based Platforms for Large Scale Neuromorphic Computing
SPX:协作研究:可扩展神经网络范式,以解决基于新兴设备的大规模神经形态计算平台的可变性
  • 批准号:
    2401544
  • 财政年份:
    2023
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Intelligent Communication Fabrics to Facilitate Extreme Scale Computing
SPX:协作研究:促进超大规模计算的智能通信结构
  • 批准号:
    2412182
  • 财政年份:
    2023
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: FASTLEAP: FPGA based compact Deep Learning Platform
SPX:协作研究:FASTLEAP:基于 FPGA 的紧凑型深度学习平台
  • 批准号:
    2333009
  • 财政年份:
    2022
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: NG4S: A Next-generation Geo-distributed Scalable Stateful Stream Processing System
SPX:合作研究:NG4S:下一代地理分布式可扩展状态流处理系统
  • 批准号:
    2202859
  • 财政年份:
    2022
  • 资助金额:
    $ 32.06万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了