CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems

CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误

基本信息

  • 批准号:
    2149664
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-12-15 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

Failures of production distributed systems are costly. Despite extensive efforts on testing distributed systems, many bugs remain difficult to find in testing even when a system is tested with appropriate input. This is because these bugs are triggered by the unique faulty events in the production environment. Fault injection has been proposed to simulate faults during testing with the goal of catching such bugs. However, existing solutions treat the target systems as a black box and only inject simple faults using random choices. Production failures are often caused by bugs that require complex, system-specific faults at careful timing to trigger.This project takes a holistic approach to address the fundamental limitations in current fault injection testing. The project develops special compiler support to enable the injection of system-specific faults at a fine granularity with precise control. To efficiently explore the large fault injection space and expose bugs, this project designs new fault injection decision algorithms and machine learning methods. A new adaptive method further analyzes production execution traces to quickly reproduce fault-induced failures in offline environment. Bugs in production distributed systems have resulted in substantial financial losses to society. The new fault injection techniques developed in this project will help effectively catch a wide range of production-grade bugs in large distributed systems and improve the availability of cloud services. This project will closely engage with developers in the open-source community to improve the distributed systems code quality and testing practice.The software artifact this project develops will be open sourced and available at https://github.com/OrderLab. The project results, including paper publications, technical reports, and presentations will be made available for free download and be maintained for at least five years beyond the completion of the project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
生产分布式系统的故障成本很高。尽管在测试分布式系统上进行了广泛的努力,但即使使用适当的输入进行了测试,许多错误仍然很难在测试中找到。这是因为这些错误是由生产环境中独特的故障事件触发的。已经提出了故障注入以模拟测试期间的故障,目的是捕获此类错误。 但是,现有解决方案将目标系统视为黑匣子,并且仅使用随机选择注入简单的故障。 生产故障通常是由于需要在谨慎时间触发时需要复杂的系统特定故障的错误引起的。该项目采用一种整体方法来解决当前故障注入测试中的基本局限性。 该项目开发了特殊的编译器支持,以使系统特定的故障以精确的控制良好。为了有效地探索大型故障注入空间并暴露了错误,该项目设计了新的故障注入决策算法和机器学习方法。一种新的自适应方法进一步分析了生产执行跟踪,以快速再现故障引起的离线环境中的故障​​。生产分布式系统中的错误已导致社会造成了巨大的财务损失。该项目中开发的新的故障注入技术将有助于有效地在大型分布式系统中捕获广泛的生产级错误,并提高云服务的可用性。该项目将与开源社区中的开发人员紧密互动,以改善分布式系统代码质量和测试实践。该项目开发的软件将是开源的,并在https://github.com/orderlab上获得。该项目的结果,包括纸质出版物,技术报告和演示文稿,将免费下载,并在项目完成之后至少维护五年。该奖项反映了NSF的法定任务,并认为值得通过基金会的知识分子优点和更广泛的审查标准通过评估来进行评估。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Peng Huang其他文献

Genome Editing Recreates Hereditary Persistence of Fetal Hemoglobin in Primary Human Erythroblasts
基因组编辑重现了原代人类成红细胞中胎儿血红蛋白的遗传持久性
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Elizabeth A. Traxler;Yu Yao;Chunliang Li;Jeremy D. Grevet;Peng Huang;Shaela Wright;G. Blobel;M. Weiss
  • 通讯作者:
    M. Weiss
Design and Hardware Implementation of Neuromorphic Systems With RRAM Synapses and Threshold-Controlled Neurons for Pattern Recognition
用于模式识别的具有 RRAM 突触和阈值控制神经元的神经形态系统的设计和硬件实现
  • DOI:
    10.1109/tcsi.2018.2812419
  • 发表时间:
    2018-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuning Jiang;Peng Huang;Dongbin Zhu;Zheng Zhou;Runze Han;Lifeng Liu;Xiaoyan Liu;Jinfeng Kang
  • 通讯作者:
    Jinfeng Kang
Tailoring the cationic and anionic sites of LaFeO3-based perovskite generates multiple vacancies for efficient water oxidation
定制 LaFeO3 基钙钛矿的阳离子和阴离子位点可产生多个空位,实现高效水氧化
  • DOI:
    10.1039/d1ta03604a
  • 发表时间:
    2021-08
  • 期刊:
  • 影响因子:
    11.9
  • 作者:
    Paul Blessington Selva;Tuzhi Xiong;Peng Huang;Qirong Tan;Yongchao Huang;Hao Yang;M.-Sadeeq Balogun
  • 通讯作者:
    M.-Sadeeq Balogun
Antitumotelomerase-selective oncolytic adenoviral agents, OBP-301(Telomelysin)in prostate Cancer
前列腺癌中的抗肿瘤端粒酶选择性溶瘤腺病毒药物 OBP-301(Telomelysin)
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yoshida;M;et. al.;Peng Huang;Enokida H. et al.;榎田 英樹;Kaku H;Urakami S. et al.;Peng Hung
  • 通讯作者:
    Peng Hung
Research on the Performance of China’s Mixed Ownership Enterprises Listed on SME Board—Based on the Perspective of Ownership Balance
我国中小企业板混合所有制企业绩效研究——基于股权制衡视角

Peng Huang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Peng Huang', 18)}}的其他基金

CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
  • 批准号:
    2317698
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
FMitF: Track I: Synthesizing Semantic Checkers for Runtime Verification of Production Distributed Systems
FMITF:第一轨:综合语义检查器以进行生产分布式系统的运行时验证
  • 批准号:
    2318937
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Towards Gray-Fault Tolerant Cloud through Harnessing and Enhancing System Observability
职业:通过利用和增强系统可观测性迈向灰色容错云
  • 批准号:
    2317751
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Towards Gray-Fault Tolerant Cloud through Harnessing and Enhancing System Observability
职业:通过利用和增强系统可观测性迈向灰色容错云
  • 批准号:
    1942794
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CRII: CSR: Toward Understanding and Automatically Detecting Specious Configuration in Large Systems
CRII:CSR:理解和自动检测大型系统中的可疑配置
  • 批准号:
    1755737
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

基于NRF2调控KPNB1促进PD-L1核转位介导非小细胞肺癌免疫治疗耐药的机制研究
  • 批准号:
    82303969
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
小胶质细胞调控外侧隔核-腹侧被盖区神经环路介导社交奖赏障碍的机制研究
  • 批准号:
    82304474
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肾去交感神经术促进下丘脑室旁核小胶质细胞M2型极化减轻心衰损伤的机制研究
  • 批准号:
    82370387
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
空间邻近标记技术研究莱茵衣藻蛋白核小管与碳浓缩机制的潜在关系
  • 批准号:
    32300220
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
polyG蛋白聚集体诱导小胶质细胞活化在神经元核内包涵体病中的作用及机制研究
  • 批准号:
    82301603
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
  • 批准号:
    2322919
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
  • 批准号:
    2343469
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
  • 批准号:
    2230945
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: SmartSight: an AI-Based Computing Platform to Assist Blind and Visually Impaired People
合作研究:中枢神经系统核心:小型:SmartSight:基于人工智能的计算平台,帮助盲人和视障人士
  • 批准号:
    2418188
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
  • 批准号:
    2317698
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了