CSR: Small: IRON: Reducing Workload Interference on Massively Parallel Platforms
CSR:小:IRON:减少大规模并行平台上的工作负载干扰
基本信息
- 批准号:1717763
- 负责人:
- 金额:$ 49.72万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2017
- 资助国家:美国
- 起止时间:2017-09-01 至 2022-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Interconnection networks based on dragonfly and fat tree designs are becoming increasingly dominant in high-performance computing facilities and data centers. A key challenge of managing such networks is workload interference. In a multi-user computing environment, interference among applications for shared network resources can cause a vicious cycle of events (workload interference, low productivity, selfish user behavior, and poor scheduling) aggravating each other. This project seeks to tackle the vicious circle of workload interference.This project aims to develop a software framework to systematically analyze and mitigate workload interference on dragonfly and fat tree systems. Completion of the project will create novel interference-aware scheduling policies and scalable software tools for interference analysis and reduction on dragonfly and fat tree networks. The resulting data and tools collected from simulations and experiments will be made available to the broad community under an open source license. An integrated education and outreach plan will enhance the Computer Science curriculum, broaden the participation by underrepresented groups, and outreach to the surrounding communities that are predominantly African-American and Latino.The proposed research focuses on three inter-related research thrusts: (1) high-fidelity network simulation to gain insights into network interference among applications, (2) interference aware scheduling to avoid or mitigate network contention among applications, and (3) real-world experiments to quantitatively measure workload interference of representative applications on production systems and assess interference aware scheduling. The resulting IRON will provide an integrated interference analysis and reduction framework for advancing the research of workload interference on massively parallel platforms. The project website (http://www.cs.iit.edu/~lan/iron.html) provides all the information about the project (publications, software tools, data, etc.). This project repository will be maintained for at least five years after the project completion.
在高性能计算设施和数据中心中,基于树和胖树设计的互连网络正变得越来越占主导地位。管理此类网络的一个关键挑战是工作负载干扰。在多用户计算环境中,共享网络资源的应用程序之间的干扰可能导致事件(工作负载干扰,低生产力,自私的用户行为和不良调度)的恶性循环,相互加剧。本项目旨在解决工作负载干扰的恶性循环。本项目旨在开发一个软件框架,以系统地分析和减轻工作负载干扰对树和胖树系统的影响。该项目的完成将创建新的干扰感知调度策略和可扩展的软件工具,用于干扰分析和减少冗余和胖树网络。从模拟和实验中收集的数据和工具将在开源许可证下提供给广大社区。一个综合的教育和推广计划将加强计算机科学课程,扩大代表性不足的群体的参与,并推广到主要是非洲裔美国人和拉丁美洲人的周边社区。拟议的研究集中在三个相互关联的研究重点:(1)高保真网络仿真,以深入了解应用程序之间的网络干扰,(2)干扰感知调度,以避免或减轻应用之间的网络争用,以及(3)真实世界实验,以定量地测量生产系统上的代表性应用的工作负载干扰并评估干扰感知调度。由此产生的IRON将提供一个集成的干扰分析和减少框架,推进大规模并行平台上的工作负载干扰的研究。 项目网站(http://www.cs.iit.edu/cnlan/iron.html)提供了关于该项目的所有信息(出版物、软件工具、数据等)。该项目资料库将在项目完成后至少维持五年。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DRAS-CQSim: A Reinforcement Learning based Framework for HPC Cluster Scheduling
- DOI:10.1016/j.simpa.2021.100077
- 发表时间:2021-05
- 期刊:
- 影响因子:0
- 作者:Yuping Fan;Z. Lan
- 通讯作者:Yuping Fan;Z. Lan
Scheduling Beyond CPUs for HPC
- DOI:10.1145/3307681.3325401
- 发表时间:2019-06
- 期刊:
- 影响因子:0
- 作者:Yuping Fan;Z. Lan;Paul M. Rich;W. Allcock;M. Papka;Brian Austin;D. Paul
- 通讯作者:Yuping Fan;Z. Lan;Paul M. Rich;W. Allcock;M. Papka;Brian Austin;D. Paul
The Effect of System Utilization on Application Performance Variability
系统利用率对应用程序性能变化的影响
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Li, Boyang;Chunduri, Sudheer;Harms, Kevin;Fan, Yuping;Lan, Zhiling
- 通讯作者:Lan, Zhiling
Trade-Off Study of Localizing Communication and Balancing Network Traffic on a Dragonfly System
Dragonfly 系统上本地化通信和平衡网络流量的权衡研究
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Wang, Xin;Mubarak, Misbah;Yang, Xu;Ross, Rob;Lan, Zhiling
- 通讯作者:Lan, Zhiling
Union: An Automatic Workload Manager for Accelerating Network Simulation
Union:用于加速网络仿真的自动工作负载管理器
- DOI:10.1109/ipdps47924.2020.00089
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Wang, Xin;Mubarak, Misbah;Kang, Yao;Ross, Robert B.;Lan, Zhiling
- 通讯作者:Lan, Zhiling
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhiling Lan其他文献
Surrogate Modeling for HPC Application Iteration Times Forecasting with Network Features
具有网络特征的 HPC 应用程序迭代时间预测的代理建模
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Xiongxiao Xu;Kevin A. Brown;Tanwi Mallick;Xin Wang;Elkin Cruz;Robert B. Ross;Christopher D. Carothers;Zhiling Lan;Kai Shu - 通讯作者:
Kai Shu
Application power profiling on IBM Blue Gene/Q
- DOI:
10.1016/j.parco.2016.05.015 - 发表时间:
2016-09-01 - 期刊:
- 影响因子:
- 作者:
Sean Wallace;Zhou Zhou;Venkatram Vishwanath;Susan Coghlan;John Tramm;Zhiling Lan;Michael E. Papka - 通讯作者:
Michael E. Papka
Zhiling Lan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhiling Lan', 18)}}的其他基金
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2413597 - 财政年份:2023
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
Collaborative Research: PPoSS: Planning: SEEr: A Scalable, Energy Efficient HPC Environment for AI-Enabled Science
合作研究:PPoSS:规划:SEEr:面向人工智能科学的可扩展、节能的 HPC 环境
- 批准号:
2119294 - 财政年份:2021
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2109316 - 财政年份:2021
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Experimental-based Research on Effective Models of Parallel Application Execution Time, Power, and Resilience
SHF:小型:协作研究:基于实验的并行应用程序执行时间、功耗和弹性有效模型的研究
- 批准号:
1618776 - 财政年份:2016
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
SHF: CSR: Small: Toward Smart HPC through Active Learning and Intelligent Scheduling
SHF:CSR:小型:通过主动学习和智能调度迈向智能 HPC
- 批准号:
1422009 - 财政年份:2014
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
SHF: CSR: Small: A Cooperative Framework for Topology Awareness on Large-Scale Systems
SHF:CSR:小型:大型系统拓扑意识的合作框架
- 批准号:
1320125 - 财政年份:2013
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
Collaborative Research: Towards Petascale Cosmological Simulations
合作研究:迈向千万亿次宇宙学模拟
- 批准号:
0904670 - 财政年份:2009
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
CSR-PSCE,SM: Recovery Aware Parallel Computing
CSR-PSCE,SM:恢复感知并行计算
- 批准号:
0834514 - 财政年份:2008
- 资助金额:
$ 49.72万 - 项目类别:
Continuing Grant
CSR/AES: Enhancing Application Robustness via Adaptive and Cooperative Methods
CSR/AES:通过自适应和协作方法增强应用程序的稳健性
- 批准号:
0720549 - 财政年份:2007
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Research and development of powder based magnetic core with small iron loss contributing to innovation in power electronics
小铁损粉末磁芯的研发有助于电力电子创新
- 批准号:
23H01398 - 财政年份:2023
- 资助金额:
$ 49.72万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Restoration of mitochondrial function by small-molecule iron transporter in Friedreich’s ataxia
小分子铁转运蛋白在弗里德赖希共济失调中恢复线粒体功能
- 批准号:
10451180 - 财政年份:2022
- 资助金额:
$ 49.72万 - 项目类别:
Restoration of Mitochondrial Function by Small-Molecule Iron Transporter in Friedreich’s Ataxia
小分子铁转运蛋白对弗里德赖希共济失调线粒体功能的恢复
- 批准号:
10558616 - 财政年份:2022
- 资助金额:
$ 49.72万 - 项目类别:
Small molecules for perturbing iron homeostasis in bacterial biofilms
扰乱细菌生物膜中铁稳态的小分子
- 批准号:
10573309 - 财政年份:2022
- 资助金额:
$ 49.72万 - 项目类别:
Stabilization of molecularly small iron oxides in layered silicates mimicking TiO2-like properties
模拟 TiO2 性质的层状硅酸盐中小分子氧化铁的稳定性
- 批准号:
21H02034 - 财政年份:2021
- 资助金额:
$ 49.72万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Excellence in Research: Direct synthesis of water soluble iron oxide nanoparticles with high relaxivity and interaction with small molecules
卓越的研究:直接合成具有高弛豫率和与小分子相互作用的水溶性氧化铁纳米颗粒
- 批准号:
2000135 - 财政年份:2020
- 资助金额:
$ 49.72万 - 项目类别:
Standard Grant
Low Power Radiofrequency-Induced Release of Small Molecules from Iron Oxide-Polymer Core-Shell Composite Nanoparticles
低功率射频诱导氧化铁-聚合物核壳复合纳米颗粒中小分子的释放
- 批准号:
447456398 - 财政年份:2020
- 资助金额:
$ 49.72万 - 项目类别:
WBP Position
Disruption of iron homeostasis and development of small airway disease and emphysema in chronic obstructive pulmonary disease
慢性阻塞性肺疾病中铁稳态的破坏以及小气道疾病和肺气肿的发展
- 批准号:
19K08624 - 财政年份:2019
- 资助金额:
$ 49.72万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Using a small molecule iron transporter to understand and treat FPN1 deficiencies in mice
使用小分子铁转运蛋白来了解和治疗小鼠 FPN1 缺陷
- 批准号:
10181021 - 财政年份:2018
- 资助金额:
$ 49.72万 - 项目类别:
Using a small molecule iron transporter to understand and treat FPN1 deficiencies in mice
使用小分子铁转运蛋白来了解和治疗小鼠 FPN1 缺陷
- 批准号:
9756457 - 财政年份:2018
- 资助金额:
$ 49.72万 - 项目类别: