OAC Core: Cost-Adaptive Monitoring and Real-Time Tuning at Function-Level
OAC核心:功能级成本自适应监控和实时调优
基本信息
- 批准号:2402542
- 负责人:
- 金额:$ 42.65万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2024
- 资助国家:美国
- 起止时间:2024-08-01 至 2026-07-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project aims to address the challenge of performance monitoring on supercomputers by developing a tool that provides function-level insights with minimal overhead, enabling real-time tuning of applications. The initiative addresses the gap in understanding computational practices within diverse scientific domains, thus aiding in informed decision-making for system design and numerical library optimization. This advancement promises to enhance the efficiency of existing supercomputing infrastructures and contributes to the NSF's mission by supporting scientific progress and educational diversity, ultimately catalyzing a broader spectrum of scientific breakthroughs.This project is designed to improve performance monitoring within high-performance computing. It aims to address the increasing complexity and diversity of applications spanning scientific research, engineering, big data, and artificial intelligence. The approach involves implementing function-level monitoring through dynamic binary instrumentation and managing the monitoring overhead with a heartbeat mechanism. Additionally, it integrates real-time tuning capabilities for optimizing numerical libraries at runtime. This endeavor seeks to enhance traditional job-level resource utilization monitoring tools significantly. The research will identify standard function calls, evaluate the instrumentation overhead, and develop and validate policies for controlling overhead and accuracy. It will also involve creating a performance benchmark for assessing real-time tuning. The intellectual merit of this project stems from its potential to provide a novel tool that offers a more precise resolution of application behaviors and enables real-time performance tuning. By introducing adaptive monitoring and real-time tuning at the function level for large computational platforms, this project aims to accelerate scientific progress. Furthermore, it promotes diversity and inclusivity by actively involving underrepresented minority groups, contributing to a more diverse and skilled workforce in high-performance computing.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在通过开发一种工具来解决超级计算机上性能监控的挑战,该工具可以以最小的开销提供功能级的洞察力,从而实现应用程序的实时调优。该倡议解决了理解不同科学领域内计算实践的差距,从而有助于系统设计和数字库优化的知情决策。这一进展有望提高现有超级计算基础设施的效率,并通过支持科学进步和教育多样性为NSF的使命做出贡献,最终催化更广泛的科学突破。该项目旨在改进高性能计算中的性能监控。它旨在解决科学研究、工程、大数据和人工智能应用日益复杂和多样化的问题。该方法包括通过动态二进制检测实现功能级监视,并使用心跳机制管理监视开销。此外,它还集成了实时调优功能,用于在运行时优化数字库。这项工作旨在显著提高传统的作业级资源利用监控工具。该研究将确定标准函数调用,评估仪器开销,并开发和验证控制开销和准确性的策略。它还将涉及创建用于评估实时调优的性能基准。这个项目的智力价值源于它提供了一种新的工具的潜力,该工具提供了更精确的应用程序行为解析,并支持实时性能调优。通过在大型计算平台的功能层面引入自适应监控和实时调优,本项目旨在加速科学进步。此外,它通过积极让代表性不足的少数群体参与进来,促进多样性和包容性,为高性能计算领域更加多样化和熟练的劳动力做出贡献。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yinzhi Wang其他文献
Performance Comparison of Julia Distributed Implementations of Dirichlet Process Mixture Models
Dirichlet 过程混合模型的 Julia 分布式实现的性能比较
- DOI:
10.1109/bigdata47090.2019.9005453 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Ruizhu Huang;Weijia Xu;Yinzhi Wang;S. Liverani;A. Stapleton - 通讯作者:
A. Stapleton
(U-Th)/He thermochronology of metallic ore deposits in the Liaodong Peninsula: Implications for orefield evolution in northeast China
辽东半岛金属矿床(U-Th)/He热年代学:对中国东北地区矿田演化的启示
- DOI:
10.1016/j.oregeorev.2017.11.025 - 发表时间:
2018 - 期刊:
- 影响因子:3.3
- 作者:
Yinzhi Wang;Fei Wang;Lin Wu;Wenbei Shi;Liekun Yang - 通讯作者:
Liekun Yang
Automatic BLAS Offloading on Unified Memory Architecture: A Study on NVIDIA Grace-Hopper
统一内存架构上的自动 BLAS 卸载:NVIDIA Grace-Hopper 的研究
- DOI:
10.1145/3626203.3670561 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Junjie Li;Yinzhi Wang;Xiao Liang;Hang Liu - 通讯作者:
Hang Liu
Perspectives and Experiences Supporting Containers for Research Computing at the Texas Advanced Computing Center
德克萨斯高级计算中心支持研究计算容器的观点和经验
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Erik Ferlanti;William J. Allen;Ernesto A. B. F. Lima;Yinzhi Wang;John Fonner - 通讯作者:
John Fonner
Optimizing GPU-Enhanced HPC System and Cloud Procurements for Scientific Workloads
优化 GPU 增强型 HPC 系统和科学工作负载的云采购
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
R. T. Evans;M. Cawood;Stephen Lien Harrell;Lei Huang;Si Liu;Chun;Amit Ruhela;Yinzhi Wang;Zhao Zhang - 通讯作者:
Zhao Zhang
Yinzhi Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yinzhi Wang', 18)}}的其他基金
Collaborative Research: Frameworks: Seismic COmputational Platform for Empowering Discovery (SCOPED)
合作研究:框架:增强发现能力的地震计算平台(SCOPED)
- 批准号:
2103494 - 财政年份:2021
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
Elements: PASSPP: Provenance-Aware Scalable Seismic Data Processing with Portability
要素: PASSPP:具有可移植性的来源感知可扩展地震数据处理
- 批准号:
1931352 - 财政年份:2019
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
相似国自然基金
胆固醇羟化酶CH25H非酶活依赖性促进乙型肝炎病毒蛋白Core及Pre-core降解的分子机制研究
- 批准号:82371765
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
锕系元素5f-in-core的GTH赝势和基组的开发
- 批准号:22303037
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于合成致死策略搭建Core-matched前药共组装体克服肿瘤耐药的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:
鼠伤寒沙门氏菌LPS core经由CD209/SphK1促进树突状细胞迁移加重炎症性肠病的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于外泌体精准调控的“核-壳”(core-shell)同步血管化骨组织工程策略的应用与机制探讨
- 批准号:
- 批准年份:2020
- 资助金额:55 万元
- 项目类别:
肌营养不良蛋白聚糖Core M3型甘露糖肽的精确制备及功能探索
- 批准号:92053110
- 批准年份:2020
- 资助金额:70.0 万元
- 项目类别:重大研究计划
Core-1-O型聚糖黏蛋白缺陷诱导胃炎发生并介导慢性胃炎向胃癌转化的分子机制研究
- 批准号:81902805
- 批准年份:2019
- 资助金额:20.5 万元
- 项目类别:青年科学基金项目
原始地球增生晚期的Core-merging大碰撞事件:地核增生、核幔平衡与核幔边界结构的新认识
- 批准号:41973063
- 批准年份:2019
- 资助金额:65.0 万元
- 项目类别:面上项目
RBM38通过协助Pol-ε结合、招募core调控HBV复制
- 批准号:31900138
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
CORDEX-CORE区域气候模拟与预估研讨会
- 批准号:41981240365
- 批准年份:2019
- 资助金额:1.5 万元
- 项目类别:国际(地区)合作与交流项目
相似海外基金
CNS Core: Small: One Size doesn't Fit All: Workload-Aware Cost Optimization for Decentralized Applications on Blockchains
CNS 核心:小:一刀切:区块链上分散式应用程序的工作负载感知成本优化
- 批准号:
2139801 - 财政年份:2022
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
CNS Core: Small: Principled Methodologies and Systems Support for Automated Cost-Effective Service Blending in the Emerging Public Cloud
CNS 核心:小型:为新兴公共云中自动化、经济高效的服务混合提供原则性方法和系统支持
- 批准号:
2122155 - 财政年份:2021
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
Redesign and Prototyping of Mining Core Cutting System for Light-weighting and Cost Optimization
采矿核心切割系统的重新设计和原型设计,以实现轻量化和成本优化
- 批准号:
549882-2020 - 财政年份:2020
- 资助金额:
$ 42.65万 - 项目类别:
Applied Research and Development Grants - Level 1
CNS Core: Medium: Collaborative Research: Towards Enabling Optimal Performance-Cost Tradeoffs in Distributed Storage
CNS 核心:中:协作研究:实现分布式存储中的最佳性能与成本权衡
- 批准号:
1900665 - 财政年份:2019
- 资助金额:
$ 42.65万 - 项目类别:
Continuing Grant
CC* Compute: A Cost-Effective, 2,048 Core InfiniBand Cluster at UTC for Campus Research and Education
CC* 计算:UTC 的具有成本效益的 2,048 核心 InfiniBand 集群,用于校园研究和教育
- 批准号:
1925603 - 财政年份:2019
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
Economic effect and social cost of IR (Integrated Resort) that casino is core
以赌场为核心的IR(综合度假村)的经济效果和社会成本
- 批准号:
19K12560 - 财政年份:2019
- 资助金额:
$ 42.65万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Light weight and cost effective composite structural core from recyclate
来自回收材料的轻质且具有成本效益的复合结构芯
- 批准号:
132226 - 财政年份:2016
- 资助金额:
$ 42.65万 - 项目类别:
Feasibility Studies
Real Time and Low Cost Core Temperature Estimation Using Wearable Sensors
使用可穿戴传感器进行实时且低成本的核心温度估算
- 批准号:
26540036 - 财政年份:2014
- 资助金额:
$ 42.65万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
STTR Phase I: Cost Effective Core-Shell Nanocatalysts for PEM Fuel Cells
STTR 第一阶段:用于质子交换膜燃料电池的具有成本效益的核壳纳米催化剂
- 批准号:
1010099 - 财政年份:2010
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
Directed assembly and photoelectric properties of core-shell nanowire networks of PbSe-TiO2 heterostructures for high efficiency low-cost solar cells
用于高效低成本太阳能电池的 PbSe-TiO2 异质结构核壳纳米线网络的定向组装和光电特性
- 批准号:
DP1096546 - 财政年份:2010
- 资助金额:
$ 42.65万 - 项目类别:
Discovery Projects