CSR---PDOS: A Benchmarking Framework for High-Availability Distributed Storage Systems

CSR---PDOS:高可用分布式存储系统的基准框架

基本信息

  • 批准号:
    1102629
  • 负责人:
  • 金额:
    $ 0.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-09 至 2011-08-31
  • 项目状态:
    已结题

项目摘要

The availability and robustness of the I/O system is crucial to large-scale applications that generate and analyze terabytes of data. Storage systems are vulnerable to numerous hardware failures (I/O and metadata server crashes) and contribute to as much as 25% of all system failures. Actually, highly available data storage for high end computing is becoming increasingly more critical as high-end computing systems scale up in size. To achieve high availability storage systems, a challenging issue is to characterize the availability metric in addition to performance of these systems.This research investigates high-availability data and I/O services and benchmarking. The investigators take an organized approach to developing a benchmarking framework to measure the storage performance in consideration of availability under various faulty conditions. The research involves four tasks: 1) develop faults/errors model and design fault injection schemes for storage systems; 2) develop an innovative benchmarking framework for high availability distributed storage systems under different faulty conditions; 3) implement an Availability and Performance Evaluation Toolset (APET) to integrate the fault injection and stress testing libraries and capture raw performance of storage systems at block level under various faults; 4) validate the benchmarking framework using APET for block-level storage systems. This research has direct contributions to understanding highly available data and I/O services for HEC systems, establishing a general benchmarking framework for characterizing storage systems under faulty conditions, and thus benefiting the society by guiding develop high-availability oriented distributed storage systems which are crucial to many applications.
I/O系统的可用性和健壮性对于生成和分析TB级数据的大规模应用程序至关重要。存储系统容易受到许多硬件故障(I/O和元数据服务器崩溃)的影响,并占所有系统故障的25%。实际上,随着高端计算系统规模的扩大,用于高端计算的高可用数据存储变得越来越重要。为了实现高可用性存储系统,一个具有挑战性的问题是描述除了这些系统的性能的可用性度量。调查人员采取有组织的方法来开发基准框架,以衡量存储性能,同时考虑各种故障条件下的可用性。研究内容包括四个方面:1)建立存储系统的故障/错误模型,设计故障注入方案; 2)建立不同故障条件下高可用分布式存储系统的基准测试框架; 3)实施可用性和性能评估工具集(APET)集成故障注入和压力测试库,捕获存储系统在各种故障下的块级原始性能; 4)使用APET对块级存储系统的基准测试框架进行验证。该研究对于理解HEC系统的高可用数据和I/O服务,建立故障条件下存储系统的通用基准测试框架,从而指导开发面向高可用性的分布式存储系统具有直接的贡献,这对许多应用至关重要。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xubin He其他文献

Reducing Fragmentation for In-line Deduplication Backup Storage via Exploiting Backup History and Cache Knowledge
通过利用备份历史记录和缓存知识减少内联重复数据删除备份存储的碎片
An Extensible I/O Performance Analysis Framework for Distributed Environments
分布式环境的可扩展 I/O 性能分析框架
IOTune: A G-states Driver for Elastic Performance of Block Storage
IOTune:块存储弹性性能的 G 状态驱动程序
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tao Lu;Ping Huang;Xubin He;Matthew Welch;Steven Gonzales;Ming Zhang
  • 通讯作者:
    Ming Zhang
StoreRush: An Application-Level Approach to Harvesting Idle Storage in a Best Effort Environment
StoreRush:一种在尽力环境中收集空闲存储的应用程序级方法
Transparent Symmetric Active/Active Replication for Service-Level High Availability
透明对称主动/主动复制,实现服务级高可用性

Xubin He的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xubin He', 18)}}的其他基金

Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
  • 批准号:
    2311758
  • 财政年份:
    2023
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134203
  • 财政年份:
    2022
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF:Small: Collaborative Research: Understanding, Modeling, and System Support for HPC Data Reduction
SHF:Small:协作研究:HPC 数据缩减的理解、建模和系统支持
  • 批准号:
    1813081
  • 财政年份:
    2018
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF:Small: Collaborative Research: Tailoring Memory Systems for Data-Intensive HPC Applications
SHF:Small:协作研究:为数据密集型 HPC 应用定制内存系统
  • 批准号:
    1717660
  • 财政年份:
    2017
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
  • 批准号:
    1700719
  • 财政年份:
    2016
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
  • 批准号:
    1702474
  • 财政年份:
    2016
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
  • 批准号:
    1320349
  • 财政年份:
    2014
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
  • 批准号:
    1218960
  • 财政年份:
    2012
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
Collaborative Research: Cross-Layer Exploration of Non-Volatile Solid-State Memories to Achieve Effective I/O Stack for High-Performance Computing Systems
协作研究:非易失性固态存储器的跨层探索,为高性能计算系统实现有效的 I/O 堆栈
  • 批准号:
    1102605
  • 财政年份:
    2010
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
RUI: Automatic Identification of I/O Bottleneck and Run-time Optimization for Cluster Virtualization
RUI:集群虚拟化I/O瓶颈自动识别与运行时优化
  • 批准号:
    1102624
  • 财政年份:
    2010
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant

相似国自然基金

基于pDOS策略的海洋甲壳源5-羟甲基糠醛衍生物的多样性合成及杀线活性评价
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

A micro-dissection platform for generating uniform-sized patient-derived tumor organoids (PDOs) for personalized cancer therapy
一个显微解剖平台,用于生成大小一致的患者来源的肿瘤类器官(PDO),用于个性化癌症治疗
  • 批准号:
    10697348
  • 财政年份:
    2022
  • 资助金额:
    $ 0.8万
  • 项目类别:
Prediction of drug efficacy by patients derived tumor organoids (PDOs) and early response markers (ERMs)
通过患者来源的肿瘤类器官(PDO)和早期反应标志物(ERM)预测药物疗效
  • 批准号:
    18H02631
  • 财政年份:
    2018
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CSR---PDOS: Online Production-Run Software Failure Diagnosis at the User Site
CSR---PDOS:用户现场生产运行软件故障在线诊断
  • 批准号:
    1022830
  • 财政年份:
    2009
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR-PDOS: Hardening Distributed Data Stores for Disaster Recovery
CSR-PDOS:强化分布式数据存储以实现灾难恢复
  • 批准号:
    0720578
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR-PDOS: BFT: The Time is Now
CSR-PDOS:BFT:现在就是时候
  • 批准号:
    0720649
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR---PDOS: A Holistic Framework for Power and Performance Control in Data Centers
CSR---PDOS:数据中心电源和性能控制的整体框架
  • 批准号:
    0720663
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR---PDOS: Online Production-Run Software Failure Diagnosis at the User Site
CSR---PDOS:用户现场生产运行软件故障在线诊断
  • 批准号:
    0720743
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR-PDOS: A Structured Development Environment for Building Robust, Higher Performance Distributed Services
CSR-PDOS:用于构建稳健、高性能分布式服务的结构化开发环境
  • 批准号:
    0720802
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR: PDOS: RIVER: Resource Management Infrastructure for Consolidated Hosting in Virtualized Data Centers
CSR:PDOS:RIVER:虚拟化数据中心整合托管的资源管理基础设施
  • 批准号:
    0720456
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR---PDOS: Distributed Capability Systems
CSR---PDOS:分布式能力系统
  • 批准号:
    0720528
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了