CRAM: A Congestion-Aware Resource and Allocation Manager for Data-Intensive High-Performance Computing

CRAM:用于数据密集型高性能计算的拥塞感知资源和分配管理器

基本信息

  • 批准号:
    0937810
  • 负责人:
  • 金额:
    $ 49.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2013-08-31
  • 项目状态:
    已结题

项目摘要

This project will develop a job scheduling and resource allocation system for data-intensive high-performance computing (HPC) based on the congestion pricing of a systems' heterogeneous resources. This extends the concept of resource management beyond processing: it allocates memory, disk I/O, and the network among jobs. The research will overcome the critical shortcomings of processor-centric resource management, which wastes huge portions of cluster and supercomputer resources for data-intensive workloads, e.g. I/O bandwidth governs the performance of many modern HPC applications but, at present, it is neither allocated nor managed. The research will develop techniques that (1) reconfigure the degree of parallelism of HPC jobs to avoid congestion and wastage, (2) support lower-priority, allocation elastic jobs that can be scheduled on arbitrary numbers of nodes to consume unallocated resource fragments, and (3) co-schedule batch-processing workloads that use system resources that are unoccupied due to asymmetric utilization and temporal shifts in the foreground jobs. These techniques will be implemented and supported for free public use as extensions to an open-source resource-management framework. If used broadly, the software has the potential to provide much better utilization of the national investment in HPC facilities.
该项目将开发一个用于数据密集型高性能计算(HPC)的作业调度和资源分配系统,该系统基于系统的异类资源的拥塞定价。这将资源管理的概念扩展到处理之外:它在作业之间分配内存、磁盘I/O和网络。这项研究将克服以处理器为中心的资源管理的严重缺陷,这种资源管理将大量的集群和超级计算机资源浪费在数据密集型工作负载上,例如,I/O带宽控制着许多现代高性能计算应用的性能,但目前既没有分配也没有管理。这项研究将开发以下技术:(1)调整高性能计算作业的并行度,以避免拥塞和浪费;(2)支持优先级较低的分配弹性作业,这些作业可以在任意数量的节点上调度以消耗未分配的资源碎片;(3)共同调度批处理工作负载,这些工作负载使用由于前台作业的不对称利用和时间转移而未占用的系统资源。这些技术将作为开放源码资源管理框架的扩展被实施和支持供公众免费使用。如果广泛使用,该软件有可能更好地利用国家对高性能计算设施的投资。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Randal Burns其他文献

Towards Optimal Line of Sight Coverage
实现最佳视线覆盖范围
DETERMINISTIC CONSTRUCTION OF SYNCHRONIZATION STRING OVER SMALL ALPHABET
小字母同步串的确定性构造
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ke Wu;X. Li;Yanif Ahmad;V. Braverman;Randal Burns;Zachary Burwell;M. Dinitz;Mark Dredze;Abhishek Jain;Philipp Koehn
  • 通讯作者:
    Philipp Koehn

Randal Burns的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Randal Burns', 18)}}的其他基金

Computational Infrastructure for Brain Research: EAGER: BrainLab CI: Collaborative, Community Experiments with Data-Quality Controls through Continuous Integration
脑研究的计算基础设施:EAGER:BrainLab CI:通过持续集成进行数据质量控制的协作社区实验
  • 批准号:
    1649880
  • 财政年份:
    2017
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
USENIX Student Stipend Grant, FAST 2014
USENIX 学生助学金,FAST 2014
  • 批准号:
    1424276
  • 财政年份:
    2014
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
USENIX Student Stipend Grant, FAST 2013
USENIX 学生助学金,FAST 2013
  • 批准号:
    1322157
  • 财政年份:
    2013
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
Archival Introspection and Maintenance Metadata
档案自省和维护元数据
  • 批准号:
    0734862
  • 财政年份:
    2007
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
Securely Managing the Lifetime of Versions in Digital Archives
安全管理数字档案中版本的生命周期
  • 批准号:
    0456027
  • 财政年份:
    2005
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
COLLABORATIVE RESEARCH: SEI + II (AST): Bypass-Yield Caching for Large-Scale Scientific Database Workloads in the World-Wide Telescope
协作研究:SEI II (AST):全球望远镜中大规模科学数据库工作负载的旁路产量缓存
  • 批准号:
    0430848
  • 财政年份:
    2004
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Continuing Grant
CAREER: Interoperation Among Heterogeneous Global-Scale Storage Systems
职业:异构全球规模存储系统之间的互操作
  • 批准号:
    0238305
  • 财政年份:
    2003
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Continuing Grant

相似海外基金

Congestion control in complex networks with higher-order interactions
具有高阶交互的复杂网络中的拥塞控制
  • 批准号:
    DP240100963
  • 财政年份:
    2024
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Discovery Projects
Development of non-invasive assessment tools of clinical congestion status using artificial intelligence for heart failure patients
利用人工智能开发心力衰竭患者临床充血状态的无创评估工具
  • 批准号:
    23K15168
  • 财政年份:
    2023
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Criticality of Urban Networks: Untangling the Complexity of Urban Congestion
城市网络的重要性:解决城市拥堵的复杂性
  • 批准号:
    2311159
  • 财政年份:
    2023
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
Profiles and impact of venous congestion on organ function and patient outcomes in sepsis
脓毒症静脉充血对器官功能和患者预后的影响
  • 批准号:
    10714259
  • 财政年份:
    2023
  • 资助金额:
    $ 49.5万
  • 项目类别:
Development of an easily deployable user-counting system for avoiding human congestion
开发易于部署的用户计数系统,以避免人员拥堵
  • 批准号:
    23K11659
  • 财政年份:
    2023
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Novel proteolytic mechanisms driving pathologic hepatic congestion in drug-induced hepatotoxicity
药物引起的肝毒性中驱动病理性肝充血的新蛋白水解机制
  • 批准号:
    10638320
  • 财政年份:
    2023
  • 资助金额:
    $ 49.5万
  • 项目类别:
CNS Core: Medium: Design and Deployment of Bespoke Congestion Control Algorithms
CNS 核心:中:定制拥塞控制算法的设计和部署
  • 批准号:
    2212390
  • 财政年份:
    2022
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Standard Grant
Development of a Holistic Traffic Monitoring Platform with Intelligent Predictive Insights to Improve Traffic Management and Reduce Congestion – "Smart Lenz"
开发具有智能预测洞察力的整体交通监控平台,以改善交通管理并减少拥堵 —“Smart Lenz”
  • 批准号:
    10016527
  • 财政年份:
    2022
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Collaborative R&D
Planification de tournées de véhicules avec congestion en contexte de chaînes d'approvisionnement durables : Modélisation et optimisation
耐用品供应链中的交通拥堵规划:模块化和优化
  • 批准号:
    RGPIN-2018-03712
  • 财政年份:
    2022
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Discovery Grants Program - Individual
Prédiction de la congestion à L'urgence grâce à l'IA
拥堵预测 — 紧急紧急 — lIA
  • 批准号:
    575917-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 49.5万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了