MSPA-MCS: Modeling, Analysis, and Learning Algorithms for Stochastic Scheduling in Clusters of Servers

MSPA-MCS:服务器集群中随机调度的建模、分析和学习算法

基本信息

  • 批准号:
    0624849
  • 负责人:
  • 金额:
    $ 49.42万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2006
  • 资助国家:
    美国
  • 起止时间:
    2006-09-01 至 2010-08-31
  • 项目状态:
    已结题

项目摘要

The investigators and their colleagues study the problem of dynamicresource management in large scale and reconfigurable clusters and developa novel stochastic framework for modeling, analysis, resourceallocation, and strategy adaptation of parallel applications.The framework features three key innovations. First, it introduces themethodology of sequential optimal stopping times into the field of parallelprocessing for designing optimal scheduling strategies. It relies on aworkload evolution model that captures both dynamic load changes andserver capacity variations in a unified structure. Second, the frameworkcontains an aggregation method that utilizes cluster structures to reducecomputational complexities, based on treatment of two-time-scale Markoviansystems developed recently. Since the Markov decision processes forremapping problems require control actions be stopping rules,the proposed techniques constitute a new paradigmof stopping rules in two-time-scale Markov systems and makea broader impact on the theory of Markov decisionprocesses. Third, the framework includes a novel learning methodology that canupdate scheduling strategies recursively to accommodate time-varyinguncertain environments in which statistical properties are not availablea priori. The methodology integrates projection and truncationalgorithms into the Q-learning procedures to enhance its implementationefficiency, state bounding, and speed of convergence. This projectestablishes asymptotic properties of the algorithms, which may shed new lightto the studies of Q-learning theory. In addition to convergence of thealgorithm under random truncations, rates of convergence are alsoascertained using an associate diffusion process. An overwhelming majority of today's supercomputers are constructedby aggregating a large number of processing nodes to overcome thebarrier of processor speed. Engineering such systemspresents key challenges, including coordination of the behaviors of theprocessing nodes to achieve high sustainable performance in real applicationsand reconfiguration of the systems in response to node/link failuresto provide fault-resilient services. Current practices often rely onheuristic approaches to the issues and offer little insights into thepotential and limitation of large scale clusters. This study intertwinestoday's discoveries of cluster computing principles with advances inmathematical sciences. Not only does it develop new knowledge about enablingtechnologies of next generation of high-end computers, but alsoit advances mathematical models and theories in new applications.Moreover, it motivates graduate and undergraduate students of diversified fields to participatein interdisciplinary research in both computer and mathematical sciences.
研究人员和他们的同事研究了大规模可重构集群中的动态资源管理问题,并提出了一个新的随机框架,用于并行应用的建模、分析、资源分配和策略调整。首先,将顺序最优停时方法引入并行处理领域,设计最优调度策略。它依赖于一个工作负载演化模型,该模型在一个统一的结构中捕获动态负载变化和服务器容量变化。 其次,该框架包含一个聚合方法,利用集群结构,以减少计算的复杂性,基于治疗的两个时间尺度马尔可夫系统最近开发的。 由于重映射问题的马尔可夫决策过程要求控制行为是停止规则,因此,本文提出的技术构成了双时间尺度马尔可夫系统中停止规则的一个新范例,并对马尔可夫决策过程理论产生了更广泛的影响。第三,该框架包括一种新的学习方法,可以递归地更新调度策略,以适应时变的不确定环境中的统计特性是不可用的先验。该方法将投影和截断算法集成到Q学习过程中,以提高其执行效率、状态边界和收敛速度。该方案建立了算法的渐近性质,为Q-学习理论的研究提供了新的思路。除了在随机截断下的算法的收敛性,收敛速度也是使用相关联的扩散过程确定。当今绝大多数的超级计算机都是通过聚合大量的处理节点来克服处理器速度的障碍。工程这样的系统提出了关键的挑战,包括协调的处理节点的行为,以实现高可持续的性能在真实的应用程序和重新配置的系统,以响应节点/链路故障,提供故障恢复服务。目前的实践往往依赖于启发式的方法来解决问题,并提供很少的洞察力的潜力和限制的大规模集群。这项研究将当今集群计算原理的发现与数学科学的进步结合在一起。 它不仅开发了关于下一代高端计算机的使能技术的新知识,而且还在新的应用中推进了数学模型和理论。此外,它激励了不同领域的研究生和本科生参与计算机和数学科学的跨学科研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chengzhong Xu其他文献

Time Stamp Algorithms for Runtime Parallelization of DOACROSS Loops with Dynamic Dependences
具有动态依赖性的 DOACROSS 循环运行时并行化的时间戳算法
HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统
Two-Level Hybrid Sampled Simulation of Multithreaded Applications
多线程应用的两级混合采样仿真
Decentralized remapping of data parallel computations with the generalized dimension exchange method
利用广义维度交换方法对数据并行计算进行分散重映射
Random choices for churn resilient load balancing in peer-to-peer networks
对等网络中流失弹性负载平衡的随机选择

Chengzhong Xu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chengzhong Xu', 18)}}的其他基金

SHF: Small: Failure Events Modeling and Analysis for Proactive Management in Highly Dependable Systems
SHF:小型:高度可靠系统中主动管理的故障事件建模和分析
  • 批准号:
    1016966
  • 财政年份:
    2010
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
REU Site in Telematics and Automotive Information Technology
REU 远程信息处理和汽车信息技术网站
  • 批准号:
    0851856
  • 财政年份:
    2009
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
CSR: Small: A Unified Reinforcement Learning Approach for Autoconfiguration of Virtualized Resources and Appliances
CSR:小型:用于自动配置虚拟化资源和设备的统一强化学习方法
  • 批准号:
    0914330
  • 财政年份:
    2009
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
CRI: Reconfigurable High Performance Cluster Computing and Medical Engineering Applications
CRI:可重构高性能集群计算和医学工程应用
  • 批准号:
    0708232
  • 财政年份:
    2007
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
Modeling and adaptive feedback control for multi-class service quality assurance in stress-resilient Internet servers
抗压互联网服务器中多级服务质量保证的建模和自适应反馈控制
  • 批准号:
    0702488
  • 财政年份:
    2007
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
SGER: Context-Aware Multi-Resource Management for High Service Availability on Internet Servers
SGER:上下文感知多资源管理,实现互联网服务器上的高服务可用性
  • 批准号:
    0611750
  • 财政年份:
    2006
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
ALGORITHMS: Adaptive Stochastic Scheduling for Bulk Synchronous Computations and Its Application in Molecular Dynamics Simulations
算法:批量同步计算的自适应随机调度及其在分子动力学模拟中的应用
  • 批准号:
    0203592
  • 财政年份:
    2002
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
Scheduling Proxy and Adaptive Algorithms for Irregular Applications on SMP Clusters
SMP集群上不规则应用的调度代理和自适应算法
  • 批准号:
    9988266
  • 财政年份:
    2000
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant

相似国自然基金

MCs激活通过影响类淋巴系统功能对GMH后脑积水的作用和机制研 究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
FGD6/RhoD/DIAPH3调控微丝重塑在Nb2C/MCS促进内皮细胞迁移中的机制研究
  • 批准号:
    82301145
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
登陆台风MCS特征观测分析及其对降水强度影响的机制研究
  • 批准号:
    42305064
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
气溶胶对华南前汛期MCS的最大瞬时和累积降水的影响机理
  • 批准号:
    42375080
  • 批准年份:
    2023
  • 资助金额:
    52.00 万元
  • 项目类别:
    面上项目
基于MCs-MCT/PAR2/TLR4通路研究健脾清化颗粒干预胃食管反流病LPS诱导的食管炎症的作用机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
益母草总生物碱抑制HIF-1α介导的MCs活化抗过敏性哮喘机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
对虾养殖池塘底泥微生物厌氧降解微囊藻毒素(MCs)的协同代谢机制研究
  • 批准号:
    32172978
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
基于Co-RBF变复杂度模型与MCS约束平移的可靠性优化方法研究
  • 批准号:
    12001505
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
西天山夏季中—β尺度MCS对流云宏微特征及对降水影响研究
  • 批准号:
    U2003106
  • 批准年份:
    2020
  • 资助金额:
    58 万元
  • 项目类别:
    联合基金项目
基于脑损伤MCS模型的脑网络重构动态演化与意识恢复机制研究
  • 批准号:
    81671038
  • 批准年份:
    2016
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目

相似海外基金

Research on the design and operation of MCS for the management of sustainable development.
研究可持续发展管理MCS的设计和运行。
  • 批准号:
    23K01687
  • 财政年份:
    2023
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
「両利きの組織」の実行を支援するMCSフレームワークの研究
支持“双元组织”实施的MCS框架研究
  • 批准号:
    22K01830
  • 财政年份:
    2022
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
サステイナビリティの取組みに対するMCSの役割に関する研究
MCS 在可持续发展工作中的作用研究
  • 批准号:
    22K01793
  • 财政年份:
    2022
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The study of MCS to support value creation related to the SDGs
MCS 研究支持与可持续发展目标相关的价值创造
  • 批准号:
    22K01785
  • 财政年份:
    2022
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on Relationship between BCP by Industry and MCS
行业BCP与MCS关系研究
  • 批准号:
    22K01788
  • 财政年份:
    2022
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
OPUS: MCS Synthesis of longitudinal '-omics' research of microbial communities in Hudson River Valley freshwater streams
OPUS:哈德逊河谷淡水溪流微生物群落纵向“组学”研究的 MCS 综合
  • 批准号:
    1950018
  • 财政年份:
    2020
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
OPUS: MCS: Mechanisms and evolution of premating reproductive isolation along a speciation continuum
作品:MCS:沿物种形成连续体的交配前生殖隔离的机制和进化
  • 批准号:
    1950302
  • 财政年份:
    2020
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
OPUS: MCS: Using modern methods with historical museum specimens to elucidate the evolution of a widespread, ecologically important rodent species
作品:MCS:利用现代方法和历史博物馆标本来阐明广泛分布的、具有重要生态意义的啮齿动物物种的进化
  • 批准号:
    1950377
  • 财政年份:
    2020
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
OPUS MCS: Developing a mechanistic understanding of methane production from small agricultural reservoirs in the Amazon-Cerrado frontier
OPUS MCS:建立对亚马逊-塞拉多边境小型农业水库甲烷生产的机械理解
  • 批准号:
    1950832
  • 财政年份:
    2020
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
OPUS: MCS - What Remains? Quantifying the First Steps of Soil Organic Carbon Formation
作品:MCS - 还剩下什么?
  • 批准号:
    1950775
  • 财政年份:
    2020
  • 资助金额:
    $ 49.42万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了