CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
基本信息
- 批准号:2149664
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-12-15 至 2023-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Failures of production distributed systems are costly. Despite extensive efforts on testing distributed systems, many bugs remain difficult to find in testing even when a system is tested with appropriate input. This is because these bugs are triggered by the unique faulty events in the production environment. Fault injection has been proposed to simulate faults during testing with the goal of catching such bugs. However, existing solutions treat the target systems as a black box and only inject simple faults using random choices. Production failures are often caused by bugs that require complex, system-specific faults at careful timing to trigger.This project takes a holistic approach to address the fundamental limitations in current fault injection testing. The project develops special compiler support to enable the injection of system-specific faults at a fine granularity with precise control. To efficiently explore the large fault injection space and expose bugs, this project designs new fault injection decision algorithms and machine learning methods. A new adaptive method further analyzes production execution traces to quickly reproduce fault-induced failures in offline environment. Bugs in production distributed systems have resulted in substantial financial losses to society. The new fault injection techniques developed in this project will help effectively catch a wide range of production-grade bugs in large distributed systems and improve the availability of cloud services. This project will closely engage with developers in the open-source community to improve the distributed systems code quality and testing practice.The software artifact this project develops will be open sourced and available at https://github.com/OrderLab. The project results, including paper publications, technical reports, and presentations will be made available for free download and be maintained for at least five years beyond the completion of the project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
生产分布式系统的故障代价高昂。尽管在测试分布式系统方面付出了广泛的努力,但即使在使用适当的输入对系统进行测试时,仍很难在测试中发现许多错误。这是因为这些错误是由生产环境中独特的故障事件触发的。已经提出了故障注入来模拟测试过程中的故障,目的是捕获此类错误。然而,现有的解决方案将目标系统视为黑匣子,只使用随机选择注入简单的故障。生产失败通常是由Bug引起的,这些Bug需要在谨慎的时间触发复杂的、特定于系统的故障。该项目采用整体方法来解决当前故障注入测试中的基本限制。该项目开发了特殊的编译器支持,以便能够以精细的粒度和精确的控制注入特定于系统的错误。为了有效地挖掘巨大的故障注入空间,暴露错误,本项目设计了新的故障注入决策算法和机器学习方法。一种新的自适应方法进一步分析生产执行轨迹,以快速再现离线环境中的故障诱导故障。生产分布式系统中的漏洞给社会造成了巨大的经济损失。该项目开发的新故障注入技术将有助于有效地捕获大型分布式系统中广泛的生产级错误,并提高云服务的可用性。这个项目将与开源社区的开发人员密切合作,以改进分布式系统的代码质量和测试实践。该项目开发的软件构件将是开源的,并可在https://github.com/OrderLab.获得项目成果,包括纸质出版物、技术报告和演示文稿,将可免费下载,并在项目完成后至少保存五年。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Peng Huang其他文献
New Method to Measure the Fill Level of the Ball Mill I-Theoretical Analysis and DEM Simulation
球磨机料位测量新方法一-理论分析与DEM模拟
- DOI:
- 发表时间:
- 期刊:
- 影响因子:4.2
- 作者:
Minping Jia;Binglin Zhong;Peng Huang - 通讯作者:
Peng Huang
OsMYB516 encoding a MYB transcriptional activator is involved in abiotic stress and circadian rhythm in rice
编码 MYB 转录激活因子的 OsMYB516 参与水稻非生物胁迫和昼夜节律
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Min Duan;Peng Huang;Xi Yuan;Hui Chen;Ji HUANG;Hongsheng Zhang - 通讯作者:
Hongsheng Zhang
Modelling and compound control of intelligently dielectric elastomer actuator
智能介电弹性体执行器建模与复合控制
- DOI:
10.1016/j.conengprac.2022.105261 - 发表时间:
2022-09 - 期刊:
- 影响因子:4.9
- 作者:
Yawu Wang;Peng Huang;Jundong Wu;Chun-Yi Su - 通讯作者:
Chun-Yi Su
Tailoring the cationic and anionic sites of LaFeO3-based perovskite generates multiple vacancies for efficient water oxidation
定制 LaFeO3 基钙钛矿的阳离子和阴离子位点可产生多个空位,实现高效水氧化
- DOI:
10.1039/d1ta03604a - 发表时间:
2021-08 - 期刊:
- 影响因子:11.9
- 作者:
Paul Blessington Selva;Tuzhi Xiong;Peng Huang;Qirong Tan;Yongchao Huang;Hao Yang;M.-Sadeeq Balogun - 通讯作者:
M.-Sadeeq Balogun
Chinese open information extraction based on DBMCSS in the eld of national information resources
国家信息资源领域基于DBMCSS的中文开放信息抽取
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:1.9
- 作者:
Jianhou Gan;Peng Huang;Juxiang Zhou;Bin Wen - 通讯作者:
Bin Wen
Peng Huang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Peng Huang', 18)}}的其他基金
CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
- 批准号:
2317698 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
FMitF: Track I: Synthesizing Semantic Checkers for Runtime Verification of Production Distributed Systems
FMITF:第一轨:综合语义检查器以进行生产分布式系统的运行时验证
- 批准号:
2318937 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Towards Gray-Fault Tolerant Cloud through Harnessing and Enhancing System Observability
职业:通过利用和增强系统可观测性迈向灰色容错云
- 批准号:
2317751 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Towards Gray-Fault Tolerant Cloud through Harnessing and Enhancing System Observability
职业:通过利用和增强系统可观测性迈向灰色容错云
- 批准号:
1942794 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CRII: CSR: Toward Understanding and Automatically Detecting Specious Configuration in Large Systems
CRII:CSR:理解和自动检测大型系统中的可疑配置
- 批准号:
1755737 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
胆固醇羟化酶CH25H非酶活依赖性促进乙型肝炎病毒蛋白Core及Pre-core降解的分子机制研究
- 批准号:82371765
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
锕系元素5f-in-core的GTH赝势和基组的开发
- 批准号:22303037
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于合成致死策略搭建Core-matched前药共组装体克服肿瘤耐药的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:
鼠伤寒沙门氏菌LPS core经由CD209/SphK1促进树突状细胞迁移加重炎症性肠病的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于外泌体精准调控的“核-壳”(core-shell)同步血管化骨组织工程策略的应用与机制探讨
- 批准号:
- 批准年份:2020
- 资助金额:55 万元
- 项目类别:
肌营养不良蛋白聚糖Core M3型甘露糖肽的精确制备及功能探索
- 批准号:92053110
- 批准年份:2020
- 资助金额:70.0 万元
- 项目类别:重大研究计划
Core-1-O型聚糖黏蛋白缺陷诱导胃炎发生并介导慢性胃炎向胃癌转化的分子机制研究
- 批准号:81902805
- 批准年份:2019
- 资助金额:20.5 万元
- 项目类别:青年科学基金项目
原始地球增生晚期的Core-merging大碰撞事件:地核增生、核幔平衡与核幔边界结构的新认识
- 批准号:41973063
- 批准年份:2019
- 资助金额:65.0 万元
- 项目类别:面上项目
RBM38通过协助Pol-ε结合、招募core调控HBV复制
- 批准号:31900138
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
CORDEX-CORE区域气候模拟与预估研讨会
- 批准号:41981240365
- 批准年份:2019
- 资助金额:1.5 万元
- 项目类别:国际(地区)合作与交流项目
相似海外基金
CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
- 批准号:
2322919 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
- 批准号:
2343469 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
- 批准号:
2317698 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Repurposing Smartphones to Minimize Carbon
CNS 核心:小型:重新利用智能手机以最大限度地减少碳排放
- 批准号:
2233894 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
- 批准号:
2230945 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: NSF-AoF: CNS Core: Small: Towards Scalable and Al-based Solutions for Beyond-5G Radio Access Networks
合作研究:NSF-AoF:CNS 核心:小型:面向超 5G 无线接入网络的可扩展和基于人工智能的解决方案
- 批准号:
2225578 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Toward Opportunistic, Fast, and Robust In-Cache AI Acceleration at the Edge
CNS 核心:小型:在边缘实现机会主义、快速且稳健的缓存内 AI 加速
- 批准号:
2228028 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: SmartSight: an AI-Based Computing Platform to Assist Blind and Visually Impaired People
合作研究:中枢神经系统核心:小型:SmartSight:基于人工智能的计算平台,帮助盲人和视障人士
- 批准号:
2418188 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Redesigning I/O Across Heterogeneous Systems
CNS 核心:小型:跨异构系统重新设计 I/O
- 批准号:
2231724 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: Creating An Extensible Internet Through Interposition
合作研究:CNS核心:小:通过介入创建可扩展的互联网
- 批准号:
2242503 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant