CSR: Large: VarSys: Managing Variability in High-Performance Computing Systems

CSR:大型:VarSys:管理高性能计算系统的可变性

基本信息

项目摘要

Exascale high-performance computing (HPC) systems are required to meet the demands of many grand challenges for scientific computing and e-commerce in the 21st century. Variability in these systems is growing intractably and leads to performance loss and energy waste. This project is building the Variability System (VarSys) software framework, grounded in fundamental engineering principles, to enable variability management in large-scale advanced computing systems. The intellectual challenges in this work include determining the extent to which variability can be managed and the tradeoffs that result from such management. The work will demonstrate the use of variability management on large scale systems and cloud infrastructures. The continuation of the project will endeavor to create methodologies to establish a community ecosystem to benchmark progress and engage a broader community in this research. Currently, there are over 25 faculty, staff and students (including 6 women and 2 minority students) participating in the project and more than 200 students have been exposed to system variability in the operating system courses. The project will also create additional compelling videos and other media artifacts to describe the progress and capture the excitement inherent to the research.Keywords: high-performance computing; statistical and mathematical modeling; variability-performance trade-offsThis award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
世纪的科学计算和电子商务面临着巨大的挑战,需要高性能的高性能计算系统。这些系统中的可变性越来越难以控制,并导致性能损失和能源浪费。该项目正在建立基于基本工程原理的可变性系统(VarSys)软件框架,以实现大规模先进计算系统的可变性管理。这项工作中的智力挑战包括确定可变性可以管理的程度以及这种管理所产生的权衡。这项工作将展示在大规模系统和云基础设施上使用可变性管理。该项目的继续将奋进创建方法,以建立一个社区生态系统,以衡量进展并使更广泛的社区参与这项研究。 目前,有超过25名教职员工和学生(包括6名妇女和2名少数民族学生)参加了该项目,200多名学生在操作系统课程中接触了系统可变性。该项目还将创建其他引人注目的视频和其他媒体工件,以描述进展情况,并捕捉研究中固有的兴奋点。关键词:高性能计算;统计和数学建模;可变性-性能权衡该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(59)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Quasi-Newton Stochastic Optimization Algorithm for Parameter Estimation of a Stochastic Model of the Budding Yeast Cell Cycle
Tokenized Incentive for Federated Learning.
联邦学习的代币化激励。
Methodologies for Quantifying (Re-)randomization Security and Timing under JIT-ROP
JIT-ROP 下量化(重新)随机化安全性和计时的方法
Efficient Metadata Indexing for HPC Storage Systems.
HPC 存储系统的高效元数据索引。
  • DOI:
    10.1109/ccgrid49817.2020.00-77
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Paul, Arnab K;Wang, Brian;Rutman, Nathan;Spitz, Cory;Butt, Ali R.
  • 通讯作者:
    Butt, Ali R.
Copula-based reliability analysis of degrading systems with dependent failures
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kirk Cameron其他文献

Interpolation of sparse high-dimensional data
  • DOI:
    10.1007/s11075-020-01040-2
  • 发表时间:
    2020-11-13
  • 期刊:
  • 影响因子:
    2.000
  • 作者:
    Thomas C. H. Lux;Layne T. Watson;Tyler H. Chang;Yili Hong;Kirk Cameron
  • 通讯作者:
    Kirk Cameron

Kirk Cameron的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kirk Cameron', 18)}}的其他基金

CNS: CORE: Small: iLORE: Computer Systems Performance Integrated Lineage Repository
CNS:核心:小型:iLORE:计算机系统性能集成谱系存储库
  • 批准号:
    1939076
  • 财政年份:
    2019
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
CSR: Large: VarSys: Managing Variability in High-Performance Computing Systems
CSR:大型:VarSys:管理高性能计算系统的可变性
  • 批准号:
    1565314
  • 财政年份:
    2016
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
CSR :Small: Exploiting Slowdowns for Speedup in Power-Scalable HPC Systems.
CSR:小:利用减速来提高功率可扩展 HPC 系统的速度。
  • 批准号:
    1422788
  • 财政年份:
    2014
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
SHF:Small:Collaborative Research: Application-aware Energy Modeling and Power Management for Parallel and High Performance Computing
SHF:Small:协作研究:用于并行和高性能计算的应用感知能源建模和电源管理
  • 批准号:
    1422712
  • 财政年份:
    2014
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
EAGER: Kinetic Computing Sculpture: A functional parallel cluster of Raspberry Pi computers that inspire computational thinking
EAGER:动能计算雕塑:激发计算思维的 Raspberry Pi 计算机功能并行集群
  • 批准号:
    1355955
  • 财政年份:
    2013
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: GridPac: A Resource Management System for Energy and Performance Optimization on Computational Grids
CSR:媒介:协作研究:GridPac:计算网格能源和性能优化的资源管理系统
  • 批准号:
    0905187
  • 财政年份:
    2009
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
CSR: Large: Collaborative Research: Multi-core Applications Modeling Infrastructure (MAMI)
CSR:大型:协作研究:多核应用建模基础设施 (MAMI)
  • 批准号:
    0910784
  • 财政年份:
    2009
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
SGER: Metrics And Methodologies for High Performance System Energy Benchmarking
SGER:高性能系统能源基准测试的指标和方法
  • 批准号:
    0848670
  • 财政年份:
    2008
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
CRI: MISER: A High-performance, Power-aware Cluster
CRI:MISER:高性能、功耗感知集群
  • 批准号:
    0709025
  • 财政年份:
    2007
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
CSR-AES: Thermal Conductors: Runtime software support for proactive heat management in advanced execution systems
CSR-AES:热导体:运行时软件支持高级执行系统中的主动热管理
  • 批准号:
    0720750
  • 财政年份:
    2007
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant

相似国自然基金

水稻穗粒数调控关键因子LARGE6的分子遗传网络解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
量子自旋液体中拓扑拟粒子的性质:量子蒙特卡罗和新的large-N理论
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    62 万元
  • 项目类别:
    面上项目
甘蓝型油菜Large Grain基因调控粒重的分子机制研究
  • 批准号:
    31972875
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
Large PB/PB小鼠 视网膜新生血管模型的研究
  • 批准号:
    30971650
  • 批准年份:
    2009
  • 资助金额:
    8.0 万元
  • 项目类别:
    面上项目
基因discs large在果蝇卵母细胞的后端定位及其体轴极性形成中的作用机制
  • 批准号:
    30800648
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
LARGE基因对口腔癌细胞中α-DG糖基化及表达的分子调控
  • 批准号:
    30772435
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目

相似海外基金

Renewal application: How do ecological trade-offs drive ectomycorrhizal fungal community assembly? Fine- scale processes with large-scale implications
更新应用:生态权衡如何驱动外生菌根真菌群落组装?
  • 批准号:
    MR/Y011503/1
  • 财政年份:
    2025
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Fellowship
Collaborative Research: Conference: Large Language Models for Biological Discoveries (LLMs4Bio)
合作研究:会议:生物发现的大型语言模型 (LLMs4Bio)
  • 批准号:
    2411529
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: Large Language Models for Biological Discoveries (LLMs4Bio)
合作研究:会议:生物发现的大型语言模型 (LLMs4Bio)
  • 批准号:
    2411530
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
CRII: OAC: A Compressor-Assisted Collective Communication Framework for GPU-Based Large-Scale Deep Learning
CRII:OAC:基于 GPU 的大规模深度学习的压缩器辅助集体通信框架
  • 批准号:
    2348465
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
Collaborative Research: Using Polarimetric Radar Observations, Cloud Modeling, and In Situ Aircraft Measurements for Large Hail Detection and Warning of Impending Hail
合作研究:利用偏振雷达观测、云建模和现场飞机测量来检测大冰雹并预警即将发生的冰雹
  • 批准号:
    2344259
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403312
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
EAGER: Liutex-based Sub-Grid Model for Large Eddy Simulation of Turbulent Flow
EAGER:基于 Liutex 的湍流大涡模拟子网格模型
  • 批准号:
    2422573
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
Continuous, Large-scale Manufacturing of Functionalized Silver Nanowire Transparent Conducting Films
功能化银纳米线透明导电薄膜的连续大规模制造
  • 批准号:
    2422696
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Standard Grant
Differentiating Cyclogenesis with and without Large Amplitude Mesoscale Gravity Waves: Implications for Rapidly Varying Heavy Precipitation and Gusty Winds
区分有和没有大振幅中尺度重力波的气旋发生:对快速变化的强降水和阵风的影响
  • 批准号:
    2334171
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
CAREER: Large scale geometry and negative curvature
职业:大规模几何和负曲率
  • 批准号:
    2340341
  • 财政年份:
    2024
  • 资助金额:
    $ 118.98万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了