SHF: Large: Collaborative Research: Next Generation Communication Mechanisms exploiting Heterogeneity, Hierarchy and Concurrency for Emerging HPC Systems

SHF:大型:协作研究:利用新兴 HPC 系统的异构性、层次结构和并发性的下一代通信机制

基本信息

  • 批准号:
    1565336
  • 负责人:
  • 金额:
    $ 40.57万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-15 至 2020-07-31
  • 项目状态:
    已结题

项目摘要

This award was partially supported by the CIF21 Software Reuse Venture whose goals are to support pathways towards sustainable software elements through their reuse, and to emphasize the critical role of reusable software elements in a sustainable software cyberinfrastructure to support computational and data-enabled science and engineering.Parallel programming based on MPI (Message Passing Interface) is being used with increased frequency in academia, government (defense and non-defense uses), as well as emerging uses in scalable machine learning and big data analytics. The emergence of Dense Many-Core (DMC) architectures like Intel's Knights Landing (KNL) and accelerator/co-processor architectures like NVIDIA GPGPUs are enabling the design of systems with high compute density. This, coupled with the availability of Remote Direct Memory Access (RDMA)-enabled commodity networking technologies like InfiniBand, RoCE, and 10/40GigE with iWARP, is fueling the growth of multi-petaflop and ExaFlop systems. These DMC architectures have the following unique characteristics: deeper levels of hierarchical memory; revolutionary network interconnects; and heterogeneous compute power and data movement costs (with heterogeneity at chip-level and node-level). For these emerging systems, a combination of MPI and other programming models, known as MPI+X (where X can be PGAS, Tasks, OpenMP, OpenACC, or CUDA), are being targeted. The current generation communication protocols and mechanisms for MPI+X programming models cannot efficiently support the emerging DMC architectures. This leads to the following broad challenges: 1) How can high-performance and scalable communication mechanisms for next generation DMC architectures be designed to support MPI+X (including Task-based) programming models? and 2) How can the current and next generation applications be designed/co-designed with the proposed communication mechanisms?A synergistic and comprehensive research plan, involving computer scientists from The Ohio State University (OSU) and Ohio Supercomputer Center (OSC) and computational scientists from the Texas Advanced Computing Center (TACC), San Diego Supercomputer Center (SDSC) and University of California San Diego (UCSD), is proposed to address the above broad challenges with innovative solutions. The research will be driven by a set of applications from established NSF computational science researchers running large scale simulations on Stampede and Comet and other systems at OSC and OSU. The proposed designs will be integrated into the widely-used MVAPICH2 library and made available for public use. Multiple graduate and undergraduate students will be trained under this project as future scientists and engineers in HPC. The established national-scale training and outreach programs at TACC, SDSC and OSC will be used to disseminate the results of this research to XSEDE users. Tutorials will be organized at XSEDE, SC and other conferences to share the research results and experience with the community.
该奖项部分得到了CIF 21软件重用项目的支持,该项目的目标是通过重用支持可持续软件元素的途径,并强调可重用软件元素在可持续软件网络基础设施中的关键作用,以支持计算和数据支持的科学和工程。(消息传递接口)在学术界、政府(国防和非国防用途)以及可扩展机器学习和大数据分析中的新兴用途中的使用频率越来越高。密集众核(DMC)架构(如英特尔的Knights Landing(KNL))和加速器/协处理器架构(如NVIDIA GPGPU)的出现使系统设计具有高计算密度。再加上支持远程直接内存访问(RDMA)的商用网络技术的可用性,如InfiniBand、RoCE和10/40 GigE与iWARP,正在推动多petaflop和ExaFlop系统的增长。这些DMC架构具有以下独特特征:更深层次的分层存储器;革命性的网络互连;以及异构计算能力和数据移动成本(芯片级和节点级的异构性)。对于这些新兴的系统,MPI和其他编程模型的组合,称为MPI+X(其中X可以是PGAS,Tasks,OpenMP,OpenACC或CUDA),正在成为目标。 当前MPI+X编程模型的通信协议和机制不能有效地支持新兴的DMC体系结构。 这导致了以下广泛的挑战:1)如何设计用于下一代DMC架构的高性能和可扩展的通信机制以支持MPI+X(包括基于任务的)编程模型?以及2)如何利用所提出的通信机制来设计/协同设计当前和下一代应用?一个协同和全面的研究计划,涉及计算机科学家从俄亥俄州州立大学(OSU)和俄亥俄州超级计算机中心(OSC)和计算科学家从得克萨斯州高级计算中心(TACC),圣地亚哥超级计算机中心(SDSC)和加州圣地亚哥大学(UCSD),提出了解决上述广泛的挑战与创新的解决方案。 这项研究将由NSF计算科学研究人员在OSC和OSU的Stampede和Comet以及其他系统上进行大规模模拟的一系列应用程序驱动。 拟议的设计将被集成到广泛使用的MVAPICH 2库中,供公众使用。 多个研究生和本科生将在这个项目下培养未来的科学家和工程师在HPC。在TACC、SDSC和OSC建立的全国范围的培训和推广计划将用于向XSEDE用户传播这项研究的结果。学术研讨会将在XSEDE、SC和其他会议上举办,与社区分享研究成果和经验。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Amitava Majumdar其他文献

Cyberinfrastructure Usage Modalities on the TeraGrid
TeraGrid 上的网络基础设施使用方式
Thermal stability, dielectric and conductivity characteristics of 9,10-anthracene-diol-anhydride polycondensates
  • DOI:
    10.1007/bf00395581
  • 发表时间:
    1990-11-01
  • 期刊:
  • 影响因子:
    4.000
  • 作者:
    Amitava Majumdar;Mukul Biswas
  • 通讯作者:
    Mukul Biswas
Ground bounce considerations in DC parametric test generation using boundary scan
使用边界扫描生成直流参数测试时的地弹注意事项
A parallel Monte Carlo code for planar and SPECT imaging: implementation, verification and applications in /sup 131/I SPECT
用于平面和 SPECT 成像的并行蒙特卡罗代码:/sup 131/I SPECT 中的实现、验证和应用
Neuromorphic computing at scale
大规模神经形态计算
  • DOI:
    10.1038/s41586-024-08253-8
  • 发表时间:
    2025-01-22
  • 期刊:
  • 影响因子:
    48.500
  • 作者:
    Dhireesha Kudithipudi;Catherine Schuman;Craig M. Vineyard;Tej Pandit;Cory Merkel;Rajkumar Kubendran;James B. Aimone;Garrick Orchard;Christian Mayr;Ryad Benosman;Joe Hays;Cliff Young;Chiara Bartolozzi;Amitava Majumdar;Suma George Cardwell;Melika Payvand;Sonia Buckley;Shruti Kulkarni;Hector A. Gonzalez;Gert Cauwenberghs;Chetan Singh Thakur;Anand Subramoney;Steve Furber
  • 通讯作者:
    Steve Furber

Amitava Majumdar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Amitava Majumdar', 18)}}的其他基金

Collaborative Research: Frameworks: hpcGPT: Enhancing Computing Center User Support with HPC-enriched Generative AI
协作研究:框架:hpcGPT:通过 HPC 丰富的生成式 AI 增强计算中心用户支持
  • 批准号:
    2411297
  • 财政年份:
    2024
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Category II: Exploring Neural Network Processors for AI in Science and Engineering
第二类:探索科学与工程中人工智能的神经网络处理器
  • 批准号:
    2005369
  • 财政年份:
    2020
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Cooperative Agreement
Collaborative Research: CIBR: Building Capacity for Data-driven Neuroscience Research
合作研究:CIBR:数据驱动神经科学研究能力建设
  • 批准号:
    1935749
  • 财政年份:
    2020
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Collaborative Research: Frameworks: Designing Next-Generation MPI Libraries for Emerging Dense GPU Systems
协作研究:框架:为新兴密集 GPU 系统设计下一代 MPI 库
  • 批准号:
    1931450
  • 财政年份:
    2019
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Promoting International Collaboration on Developing Scalable, Portable & Efficient HPC Software for Modern HPC Platforms
促进开发可扩展、便携的国际合作
  • 批准号:
    1849519
  • 财政年份:
    2018
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO: Collaborative Research: ABI Development: Seamless Integration of Neuroscience Models and Tools with HPC - Easy Path to Supercomputing for Neuroscience
双边 BBSRC-NSF/BIO:合作研究:ABI 开发:神经科学模型和工具与 HPC 的无缝集成 - 神经科学超级计算的简单途径
  • 批准号:
    1458840
  • 财政年份:
    2015
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
BIGDATA: F: DKM: Collaborative Research: Scalable Middleware for Managing and Processing Big Data on Next Generation HPC Systems
BIGDATA:F:DKM:协作研究:用于在下一代 HPC 系统上管理和处理大数据的可扩展中间件
  • 批准号:
    1447861
  • 财政年份:
    2014
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Unified Runtime for Supporting Hybrid Programming Models on Heterogeneous Architecture.
SHF:大型:协作研究:支持异构架构上的混合编程模型的统一运行时。
  • 批准号:
    1213056
  • 财政年份:
    2012
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: A Comprehensive Performance Tuning Framework for the MPI Stack
合作研究:SI2-SSI:MPI 堆栈的综合性能调优框架
  • 批准号:
    1147926
  • 财政年份:
    2012
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Development: Building A Community Resource for Neuroscientists
合作研究:ABI 开发:为神经科学家建立社区资源
  • 批准号:
    1146949
  • 财政年份:
    2012
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant

相似国自然基金

水稻穗粒数调控关键因子LARGE6的分子遗传网络解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
量子自旋液体中拓扑拟粒子的性质:量子蒙特卡罗和新的large-N理论
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    62 万元
  • 项目类别:
    面上项目
甘蓝型油菜Large Grain基因调控粒重的分子机制研究
  • 批准号:
    31972875
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
Large PB/PB小鼠 视网膜新生血管模型的研究
  • 批准号:
    30971650
  • 批准年份:
    2009
  • 资助金额:
    8.0 万元
  • 项目类别:
    面上项目
基因discs large在果蝇卵母细胞的后端定位及其体轴极性形成中的作用机制
  • 批准号:
    30800648
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
LARGE基因对口腔癌细胞中α-DG糖基化及表达的分子调控
  • 批准号:
    30772435
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
  • 批准号:
    2402804
  • 财政年份:
    2024
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling GPU Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的 GPU 性能仿真
  • 批准号:
    2402806
  • 财政年份:
    2024
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling GPU Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的 GPU 性能仿真
  • 批准号:
    2402805
  • 财政年份:
    2024
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Molecular computing for the real world
SHF:大型:协作研究:现实世界的分子计算
  • 批准号:
    1832985
  • 财政年份:
    2018
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Continuing Grant
SHF: Large: Collaborative Research: Next Generation Communication Mechanisms exploiting Heterogeneity, Hierarchy and Concurrency for Emerging HPC Systems
SHF:大型:协作研究:利用新兴 HPC 系统的异构性、层次结构和并发性的下一代通信机制
  • 批准号:
    1565414
  • 财政年份:
    2016
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Exploiting the Naturalness of Software
SHF:大型:协作研究:利用软件的自然性
  • 批准号:
    1723215
  • 财政年份:
    2016
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Continuing Grant
SHF: Large: Collaborative Research: Next Generation Communication Mechanisms exploiting Heterogeneity, Hierarchy and Concurrency for Emerging HPC Systems
SHF:大型:协作研究:利用新兴 HPC 系统的异构性、层次结构和并发性的下一代通信机制
  • 批准号:
    1565431
  • 财政年份:
    2016
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Molecular computing for the real world
SHF:大型:协作研究:现实世界的分子计算
  • 批准号:
    1518715
  • 财政年份:
    2015
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Continuing Grant
SHF: Large: Collaborative Research: Molecular computing for the real world
SHF:大型:协作研究:现实世界的分子计算
  • 批准号:
    1518833
  • 财政年份:
    2015
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Continuing Grant
SHF: Large: Collaborative Research: Molecular computing for the real world
SHF:大型:协作研究:现实世界的分子计算
  • 批准号:
    1518723
  • 财政年份:
    2015
  • 资助金额:
    $ 40.57万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了