SHF: Small: Collaborative Research: Experimental-based Research on Effective Models of Parallel Application Execution Time, Power, and Resilience
SHF:小型:协作研究:基于实验的并行应用程序执行时间、功耗和弹性有效模型的研究
基本信息
- 批准号:1618776
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-09-01 至 2021-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The increasing scale and complexity of parallel systems present enormous challenges to parallel applications. One such challenge is the integration and balancing of execution time, power, and resilience for parallel applications. The MuMMI_R project seeks to advance the scientific understanding of the interdependence among power, execution time, and resilience for various application-system configurations. The broader impacts include training of undergraduate and graduate students and the participation in programs such as REUs, CREU, and DREU to increase the participation of students from underrepresented groups in the project.The MuMMI_R research aims to develop effective techniques for quantifying the complicated tradeoffs among execution time, power, and resilience, and to provide a tuning mechanism for user-defined metrics. Toward this goal, the research focuses on three interrelated research thrusts: (1) experimental research to conduct extensive experiments of a suite of representative application under different resilience strategies on various parallel architectures, (2) application-level co-modeling to develop analytical models and colored Petri net based simulation for quantifying the correlations and tradeoffs between execution time, power, and resilience, and (3) model-based analysis to examine the tradeoffs among resilience, execution time, and power for different application-system configurations, and to tune application implementations for a user-defined target metric on current and future systems. The resulting framework, MuMMI_R, will provide valuable insights into application-system interactions and aid in the design of efficient parallel applications (with respect to execution time, power requirements, and resilience), runtime systems, and computer architectures.
平行系统的规模和复杂性的增加对并行应用提出了巨大的挑战。一个这样的挑战是对并行应用程序的执行时间,功率和弹性的集成和平衡。 Mummi_r项目旨在提高对各种应用程序配置的功率,执行时间和弹性之间相互依赖性的科学理解。更广泛的影响包括对本科生和研究生的培训,以及参与REUS,CREU和DREU等计划,以增加项目中代表性不足的小组的学生的参与。Mummi_R研究旨在开发有效的技术,以量化执行时间,权力,稳定性和互补的机制,并提供一种调整的方法,以量化复杂的交易。为了实现这一目标,该研究集中于三个相互关联的研究推力:(1)实验研究,以对各种平行体系结构的不同复原力策略进行一套代表性应用的广泛实验,(2)应用程序级别的共同建模,以开发分析模型和有色PETRI净基于petri net的模型,以量化质量和竞争的模型,以量化(量化),以量化(Quormity oferction和Reseftion),以量化(Quartifials和Reser)的势力,(3在不同应用程序系统配置的弹性,执行时间和功率中,以及针对当前和将来系统上用户定义的目标度量的应用程序实现。最终的框架Mummi_r将提供对应用程序系统交互的宝贵见解,并有助于设计有效的并行应用程序(关于执行时间,功率要求和弹性),运行时系统和计算机体系结构。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Union: An Automatic Workload Manager for Accelerating Network Simulation
Union:用于加速网络仿真的自动工作负载管理器
- DOI:10.1109/ipdps47924.2020.00089
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Wang, Xin;Mubarak, Misbah;Kang, Yao;Ross, Robert B.;Lan, Zhiling
- 通讯作者:Lan, Zhiling
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhiling Lan其他文献
Surrogate Modeling for HPC Application Iteration Times Forecasting with Network Features
具有网络特征的 HPC 应用程序迭代时间预测的代理建模
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Xiongxiao Xu;Kevin A. Brown;Tanwi Mallick;Xin Wang;Elkin Cruz;Robert B. Ross;Christopher D. Carothers;Zhiling Lan;Kai Shu - 通讯作者:
Kai Shu
Application power profiling on IBM Blue Gene/Q
- DOI:
10.1016/j.parco.2016.05.015 - 发表时间:
2016-09-01 - 期刊:
- 影响因子:
- 作者:
Sean Wallace;Zhou Zhou;Venkatram Vishwanath;Susan Coghlan;John Tramm;Zhiling Lan;Michael E. Papka - 通讯作者:
Michael E. Papka
Zhiling Lan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhiling Lan', 18)}}的其他基金
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2413597 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: PPoSS: Planning: SEEr: A Scalable, Energy Efficient HPC Environment for AI-Enabled Science
合作研究:PPoSS:规划:SEEr:面向人工智能科学的可扩展、节能的 HPC 环境
- 批准号:
2119294 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2109316 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CSR: Small: IRON: Reducing Workload Interference on Massively Parallel Platforms
CSR:小:IRON:减少大规模并行平台上的工作负载干扰
- 批准号:
1717763 - 财政年份:2017
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF: CSR: Small: Toward Smart HPC through Active Learning and Intelligent Scheduling
SHF:CSR:小型:通过主动学习和智能调度迈向智能 HPC
- 批准号:
1422009 - 财政年份:2014
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF: CSR: Small: A Cooperative Framework for Topology Awareness on Large-Scale Systems
SHF:CSR:小型:大型系统拓扑意识的合作框架
- 批准号:
1320125 - 财政年份:2013
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: Towards Petascale Cosmological Simulations
合作研究:迈向千万亿次宇宙学模拟
- 批准号:
0904670 - 财政年份:2009
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CSR-PSCE,SM: Recovery Aware Parallel Computing
CSR-PSCE,SM:恢复感知并行计算
- 批准号:
0834514 - 财政年份:2008
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
CSR/AES: Enhancing Application Robustness via Adaptive and Cooperative Methods
CSR/AES:通过自适应和协作方法增强应用程序的稳健性
- 批准号:
0720549 - 财政年份:2007
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
相似国自然基金
基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
- 批准号:
- 批准年份:2020
- 资助金额:57 万元
- 项目类别:面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
- 批准号:61661005
- 批准年份:2016
- 资助金额:30.0 万元
- 项目类别:地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
- 批准号:61301143
- 批准年份:2013
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
- 批准号:81072465
- 批准年份:2010
- 资助金额:31.0 万元
- 项目类别:面上项目
基于小世界网络的传感器网络研究
- 批准号:60472059
- 批准年份:2004
- 资助金额:21.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
- 批准号:
2412357 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
- 批准号:
2326895 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
- 批准号:
2334624 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant