CSR: Small: Automatic Storage and Network Contention Management for Large-scale High-performance Computing Systems
CSR:小型:大规模高性能计算系统的自动存储和网络争用管理
基本信息
- 批准号:1528179
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-09-01 至 2019-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
High performance computing is essential to science, industry, and the environment, from resource exploration to the design of the next generation of consumer electronics. These high performance computer systems are among the most complex and expensive computer systems and require that their resources be used in the most efficient manner. Many of the applications that utilize high performance computing are data-intensive, and storage system performance is a crucial aspect of system performance. However, storage systems are notoriously sensitive to contention caused by competition among storage clients for limited bandwidth and disk access. This is a significant problem for shared storage systems. This project provides an automatic storage contention alleviation and reduction system (ASCAR) for large-scale high-performance storage to increase bandwidth utilization and fairness of resource allocation. ASCAR uses machine learning methods combined with several heuristics to discover the fittest control strategy. It is a highly scalable and fully automatic storage contention and congestion management system, which can improve the efficiency of both legacy and new systems, with no need to change either server hardware/software or existing applications. ASCAR regulates I/O traffic from the client side using a rule based algorithm. It employs a shared-nothing design and requires no runtime coordination between clients or with a central coordinator whatsoever, because runtime coordination is slow and unscalable. The effectiveness of ASCAR relies on the quality of traffic control. The research team has designed a prototype algorithm, the SHAred-nothing Rule Producer (SHARP), which produces rules in an unsupervised manner by systematically exploring the solution space of possible designs. Starting from one initial rule, SHARP uses heuristics similar to random-restart hill climbing to find the optimal parameters without the need for an exhaustive search. ASCAR monitors the workloads running on the system and uses several heuristics to pick up the fittest rules. It is clear that computer systems are getting ever more sophisticated, and human-lead empirical-based approach towards system optimization is not the most efficient way to realize the full potential of these modern, complex, high performance computing systems. This research brings machine learning, artificial intelligence, and big data methods to systems research and could lead to a very low cost I/O performance increase for a wide range of systems.
从资源勘探到下一代消费电子产品的设计,高性能计算对科学、工业和环境至关重要。这些高性能计算机系统是最复杂和昂贵的计算机系统之一,并且要求以最有效的方式使用它们的资源。许多利用高性能计算的应用程序都是数据密集型的,存储系统性能是系统性能的一个关键方面。然而,众所周知,存储系统对由存储客户端之间对有限带宽和磁盘访问的竞争引起的争用非常敏感。这对于共享存储系统来说是一个严重的问题。本计画针对大规模高效能储存环境,提供一个自动储存争用缓解与减少系统(ASCAR),以提升频宽利用率与资源分配的公平性。ASCAR使用机器学习方法结合几种算法来发现最合适的控制策略。它是一个高度可扩展和全自动的存储争用和拥塞管理系统,可以提高旧系统和新系统的效率,而无需更改服务器硬件/软件或现有应用程序。ASCAR使用基于规则的算法调节来自客户端的I/O流量。它采用了无共享的设计,不需要客户端之间的运行时协调,也不需要与中央协调器进行任何协调,因为运行时协调速度很慢,而且不可扩展。ASCAR的有效性依赖于交通控制的质量。研究团队设计了一个原型算法,SHARP规则生成器(SHARP),它通过系统地探索可能设计的解决方案空间,以无监督的方式生成规则。从一个初始规则开始,SHARP使用类似于随机重启爬山的算法来找到最佳参数,而不需要穷举搜索。ASCAR监控系统上运行的工作负载,并使用多种启发式方法来选择最合适的规则。很明显,计算机系统变得越来越复杂,而人类主导的基于化学的系统优化方法并不是实现这些现代,复杂,高性能计算系统的全部潜力的最有效方法。这项研究将机器学习、人工智能和大数据方法引入系统研究,并可能为各种系统带来非常低成本的I/O性能提升。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Darrell Long其他文献
Oasis: 一种基于对象的主动存储框架
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Yulai Xie;Dan Feng;Yan Li;Darrell Long - 通讯作者:
Darrell Long
Paradise: Real-Time, Generalized, and Distributed Provenance-Based Intrusion Detection
- DOI:
10.1109/TDSC.2022.3160879 - 发表时间:
2022 - 期刊:
- 影响因子:7.3
- 作者:
Yafeng Wu;Yulai Xie;Lin Wu;Xuelong Liao;Dan Feng;Pan Zhou;Xuan Li;Avani Wildani;Darrell Long - 通讯作者:
Darrell Long
Efficient Provenance Management via Clustering and Hybrid Storage in Big Data Environments
在大数据环境中通过集群和混合存储进行高效的来源管理
- DOI:
10.1109/tbdata.2019.2907116 - 发表时间:
2020-12 - 期刊:
- 影响因子:7.2
- 作者:
Die Hu;Dan Feng;Yulai Xie;Gongming Xu;Xinrui Gu;Darrell Long - 通讯作者:
Darrell Long
Darrell Long的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Darrell Long', 18)}}的其他基金
CSR: Small: A Multi-Layered Deniable Steganographic File System
CSR:小型:多层可否认的隐写文件系统
- 批准号:
1814347 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SHF:AF:Small:Collaborative Research:RESAR: Robust, Efficient, Scalable, Autonomous Reliable Storage for the Cloud
SHF:AF:Small:协作研究:RESAR:稳健、高效、可扩展、自主可靠的云存储
- 批准号:
1219163 - 财政年份:2012
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
TC: Small: LockBox: Enabling Users to Keep Data Safe
TC:小型:LockBox:使用户能够保证数据安全
- 批准号:
1018928 - 财政年份:2010
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
A Scalable On-Line Associative Deep Store
可扩展的在线关联深度存储
- 批准号:
0310888 - 财政年份:2003
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Applications of Data Grouping for Effective Mobility
数据分组在有效移动中的应用
- 批准号:
0204358 - 财政年份:2002
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Architectures and Algorithms to Exploit Probe-Based Storage
利用基于探针的存储的架构和算法
- 批准号:
0073509 - 财政年份:2000
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
COLLABORATIVE RESEARCH: An Experimental Study of Broadcasting Protocols for Video-on-Demand
合作研究:视频点播广播协议的实验研究
- 批准号:
9988363 - 财政年份:2000
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
High Performance Integration of Advanced Tertiary Stores
高级三级商店的高性能集成
- 批准号:
9972212 - 财政年份:1999
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Improving Cache Performance by Predicting I/O System Actions
通过预测 I/O 系统操作来提高缓存性能
- 批准号:
9704347 - 财政年份:1997
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
相似国自然基金
基于同步辐射晶体学线站的小分子化合物片段库自动化筛选研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多模态遥感影像小目标检测网络少样本训练和自动构建研究及应用
- 批准号:
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
自动化生产、人工智能与小微企业的市场进入——基于劳动者职业选择的视角
- 批准号:72103098
- 批准年份:2021
- 资助金额:24.00 万元
- 项目类别:青年科学基金项目
自动化生产、人工智能与小微企业的市场进入---基于劳动者职业选择的视角
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:
汉语小句复合体结构自动分析研究
- 批准号:62076037
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
血液中自动披覆蛋白冠“马甲”的紫杉醇小分子自组装纳米药物的构建及其体内命运的研究
- 批准号:82003704
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
针对无人车弱特征小物体检测的深度神经网络要素关联调制机制研究
- 批准号:61906138
- 批准年份:2019
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
小胶质细胞“IL-1β自动调节系统”保护脑缺血后神经元的机制研究
- 批准号:
- 批准年份:2019
- 资助金额:10.0 万元
- 项目类别:省市级项目
三维属性直方图的概念与构建及其在海底小目标多波束前视声呐图像精细自动分割中的应用
- 批准号:61661038
- 批准年份:2016
- 资助金额:44.0 万元
- 项目类别:地区科学基金项目
小尺度极光弧的物理特征及产生机制研究
- 批准号:41504122
- 批准年份:2015
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
SaTC: CORE: Small: Automatic Exploits Detection and Mitigation for Industrial Control System Protocols
SaTC:核心:小型:工业控制系统协议的自动漏洞检测和缓解
- 批准号:
2345563 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Automatic Identification of Privilege-guard Variables for Data-only Attacks and Defenses
SaTC:核心:小型:自动识别纯数据攻击和防御的权限保护变量
- 批准号:
2247652 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: Automatic Detection and Repair of Side Channel Vulnerabilities in Software Code
SaTC:CORE:小型:自动检测和修复软件代码中的侧信道漏洞
- 批准号:
2245344 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: Sound Automatic Exploit Generation
SaTC:核心:小:声音自动漏洞利用生成
- 批准号:
2234257 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
CCF: SHF: Small: Self-Adaptive Interference-Avoiding Wireless Receiver Hardware through Real-Time Learning-Based Automatic Optimization of Power-Efficient Integrated Circuits
CCF:SHF:小型:通过基于实时学习的高能效集成电路自动优化实现自适应干扰避免无线接收器硬件
- 批准号:
2218845 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
NSF-BSF: SHF: Small: Efficient, Automatic, and Trustworthy Smart Contract Verification
NSF-BSF:SHF:小型:高效、自动且值得信赖的智能合约验证
- 批准号:
2110397 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Automatic Exploits Detection and Mitigation for Industrial Control System Protocols
SaTC:核心:小型:工业控制系统协议的自动漏洞检测和缓解
- 批准号:
2051621 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Accelerating Machine Learning via Randomized Automatic Differentiation
RI:小型:通过随机自动微分加速机器学习
- 批准号:
2007278 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SHF: Small: Automatic, adaptive and massive parallel data processing on GPU/RDMA clusters in both synchronous and asynchronous modes
SHF:小型:在同步和异步模式下在 GPU/RDMA 集群上自动、自适应和大规模并行数据处理
- 批准号:
2005884 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Adaptive control for agile automatic welding in small batches
小批量敏捷自动焊接的自适应控制
- 批准号:
530116-2018 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Collaborative Research and Development Grants