CSR: Small: Accelerating Data Intensive Scientific Workflows with Consistency Contracts

CSR:小:通过一致性合同加速数据密集型科学工作流程

基本信息

  • 批准号:
    2317556
  • 负责人:
  • 金额:
    $ 59.97万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-10-01 至 2026-09-30
  • 项目状态:
    未结题

项目摘要

Advanced discovery in scientific computing increasingly depends upon the successful execution of complex workflows that combine multiple applications together to run in concert on a large high performance cluster. A widespread challenge in this setting is the performance of the shared parallel filesystem. Because each file system interaction has very different needs in terms of performance and consistency, the filesystem is obliged to follow the most conservative approach to handle the worst case. As a result, peak performance is rarely achieved. We propose "consistency contracts" as the solution to this problem. This novel approach requires the workflow as a whole to declare its intended uses of the file system at the start of each execution, allowing the runtime system to perform a variety of optimizations. This project will evaluate the concept of consistency contracts by constructing an experimental system (Pledge) that enables and enforces contracts on existing data intensive workflows, with minimal disruption to current practice. We hypothesize that this approach will significantly improve performance for data intensive scientific applications running on high performance clusters,and has the potential to be more widely applied. Our focus on consistency results from our observation that today's shared parallel filesystem is asked to fill multiple roles: moving large files, delivering complex software trees, providing buffers between tasks, and providing synchronization between tasks. Current filesystems provide the most conservative sequential consistency to handle the worst case. Rather than depend upon the shared filesystem to perform last-minute runtime arbitration of every individual filesystem operation, we argue that the workflow as a whole should declare its intentions for the duration of the execution, indicating the paths, access modes, and consistency requirements needed for the entire workflow run. With a contract in hand, the runtime system can then perform a variety of optimizations that exploit the internal storage and I/O capacity of the cluster as a whole, for example utilizing a streamlined approach for read-only access. We hypothesize that workflow-level consistency management will yield higher effective I/O bandwidth and transaction rates than strict global consistency management for data intensive scientific applications running on high performance clusters. These improved I/O rates will translate into faster end-to-end runtimes and fewer unexpected performance failures for end users and system administrators.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
科学计算中的高级发现越来越依赖于复杂工作流的成功执行,这些工作流将多个应用程序组合在一起,以便在大型高性能集群上协调运行。这种设置中的一个普遍挑战是共享并行文件系统的性能。因为每个文件系统交互在性能和一致性方面都有非常不同的需求,所以文件系统必须遵循最保守的方法来处理最坏的情况。因此,很少能达到最佳性能。我们提出“一致性契约”作为这个问题的解决方案。这种新颖的方法要求工作流作为一个整体在每次执行开始时声明其对文件系统的预期用途,从而允许运行时系统执行各种优化。该项目将通过建立一个试验性系统(Pledge)来评估一致性合同的概念,该系统能够启用和执行现有数据密集型工作流程的合同,并最大限度地减少对当前做法的干扰。我们假设这种方法将显著提高在高性能集群上运行的数据密集型科学应用的性能,并具有更广泛应用的潜力。我们对一致性的关注源于我们的观察,即今天的共享并行文件系统被要求扮演多个角色:移动大型文件、交付复杂的软件树、在任务之间提供缓冲区以及在任务之间提供同步。当前的文件系统提供了最保守的顺序一致性来处理最坏的情况。与其依赖共享文件系统对每个单独的文件系统操作执行最后一刻的运行时仲裁,我们认为工作流作为一个整体应该声明其在执行持续时间内的意图,指示整个工作流运行所需的路径、访问模式和一致性要求。有了合同,运行时系统就可以执行各种优化,将集群的内部存储和I/O容量作为一个整体加以利用,例如利用只读访问的简化方法。我们假设,对于在高性能集群上运行的数据密集型科学应用程序,工作流级一致性管理将比严格的全局一致性管理产生更高的有效I/O带宽和事务率。这些改进的I/O速率将为最终用户和系统管理员带来更快的端到端运行时间和更少的意外性能故障。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Douglas Thain其他文献

Experience with BXGrid: a data repository and computing grid for biometrics research
Poster: Robust Meta-Workflow Management with Mufasa
海报:使用 Mufasa 进行稳健的元工作流程管理
Multiple Bypass: Interposition Agents for Distributed Computing

Douglas Thain的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Douglas Thain', 18)}}的其他基金

CSSI Elements: DataSwarm: A User-Level Framework for Data Intensive Scientific Applications
CSSI 元素:DataSwarm:数据密集型科学应用程序的用户级框架
  • 批准号:
    1931348
  • 财政年份:
    2019
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
REU Site: Data Intensive Scientific Computing
REU 站点:数据密集型科学计算
  • 批准号:
    1560363
  • 财政年份:
    2016
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SI2-SSE: Scaling up Science on Cyberinfrastructure with the Cooperative Computing Tools
SI2-SSE:利用协作计算工具扩大网络基础设施科学规模
  • 批准号:
    1642409
  • 财政年份:
    2016
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
Collaborative Research: Software Sustainability: an SI^2 PI Workshop
协作研究:软件可持续性:SI^2 PI 研讨会
  • 批准号:
    1419132
  • 财政年份:
    2014
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SI2-SSE: Connecting Cyberinfrastructure with the Cooperative Computing Tools
SI2-SSE:将网络基础设施与协作计算工具连接起来
  • 批准号:
    1148330
  • 财政年份:
    2012
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
Collaborative Research: II-New: Distributed Research Testbed (DiRT)
协作研究:II-新:分布式研究测试台 (DiRT)
  • 批准号:
    0855047
  • 财政年份:
    2009
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
CAREER: Data Intensive Grid Computing on Active Storage Clusters
职业:活动存储集群上的数据密集型网格计算
  • 批准号:
    0643229
  • 财政年份:
    2007
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Continuing Grant
HECURADeconstructing Clusters for High End Biometric Applications
HECURA解构高端生物识别应用的集群
  • 批准号:
    0621434
  • 财政年份:
    2007
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SGER: Enabling Electronic Self-Defense with Dynamic Identities
SGER:通过动态身份实现电子自卫
  • 批准号:
    0549087
  • 财政年份:
    2005
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CC* INTEGRATION-SMALL: ADIABATIC MICROSERVICE LEVEL LOAD BALANCED FORWARDING ON PISA SWITCH FOR ACCELERATING URGENT PROCESSES IN SCIENCE DATA CENTER NETWORKS
CC* 集成小型:PISA 交换机上的绝热微服务级负载平衡转发,用于加速科学数据中心网络中的紧急进程
  • 批准号:
    2346729
  • 财政年份:
    2024
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SBIR Phase II: Accelerating R&D through Streamlined Machine Learning Algorithms for Small Data Applications in Advanced Manufacturing
SBIR 第二阶段:加速 R
  • 批准号:
    2325045
  • 财政年份:
    2023
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Cooperative Agreement
Collaborative Research: CNS Core: Small: Accelerating Serverless Cloud Network Performance
协作研究:CNS 核心:小型:加速无服务器云网络性能
  • 批准号:
    2229454
  • 财政年份:
    2023
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Accelerating Serverless Cloud Network Performance
协作研究:CNS 核心:小型:加速无服务器云网络性能
  • 批准号:
    2229455
  • 财政年份:
    2023
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
CIF: Small: Accelerating Stochastic Approximation for Optimization and Reinforcement Learning
CIF:小型:加速优化和强化学习的随机逼近
  • 批准号:
    2306023
  • 财政年份:
    2023
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SHF: Small: A General Framework for Accelerating AI on Resource-Constrained Edge Devices
SHF:小型:在资源受限的边缘设备上加速 AI 的通用框架
  • 批准号:
    2211163
  • 财政年份:
    2022
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SHF: Small: NPU-based Architecture for Accelerating Deep Learning on Mobile Devices
SHF:小型:基于 NPU 的架构,用于加速移动设备上的深度学习
  • 批准号:
    2125208
  • 财政年份:
    2021
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Accelerating Privacy Preserving Deep Learning for Real-time Secure Applications
SaTC:核心:小型:加速实时安全应用程序的隐私保护深度学习
  • 批准号:
    2104264
  • 财政年份:
    2021
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
RI: Small: Accelerating Machine Learning via Randomized Automatic Differentiation
RI:小型:通过随机自动微分加速机器学习
  • 批准号:
    2007278
  • 财政年份:
    2020
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
CNS Core: Small: AccelRITE: Accelerating ReInforcemenT Learning based AI at the Edge Using FPGAs
CNS 核心:小型:AccelRITE:使用 FPGA 在边缘加速基于强化学习的 AI
  • 批准号:
    2009057
  • 财政年份:
    2020
  • 资助金额:
    $ 59.97万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了