A Study of the Impact of Network Partitioning Faults on Cloud Systems
网络分区故障对云系统影响的研究
基本信息
- 批准号:528813-2018
- 负责人:
- 金额:$ 1.82万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Engage Grants Program
- 财政年份:2018
- 资助国家:加拿大
- 起止时间:2018-01-01 至 2019-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Google distributed systems are designed to be highly available despite failures of devices, machines, and**networks. Network-partitioning faults impose a unique challenge: They are some of the most**complex-to-handle faults but unfortunately are increasingly occurring in modern data centers.**We aim to conduct an in-depth characterization study of network-partitioning-related failures in five widely**used production-quality systems that mimic Google's internal systems. Our goal is to better understand the**impact of network partitioning on modern distributed systems, to understand the specific sequence of events**that lead to user-visible system failures, and to characterize these system failures to identify opportunities for**improving system fault tolerance. We plan to use our findings to design the network partitioning testing**(NPTest) framework, a system-level testing framework that can create and heal network partitions. For a wider**impact, we plan to make NPTest open source.**This project characterizes the impact of complex faults of modern networks and has the potential to have a**wide influence on technology, including Google Canada, which builds Web-scale systems. Furthermore, for**data centers (including the more than 200 centers located in Canada), this research program will improve the**reliability of a wide range of systems and bring benefits to a wide set of cloud applications, including**applications in fields such as medical informatics, online social networks, AI and machine learning systems,**smart energy distribution systems, and text analytics. Finally, this program will provide an invaluable**opportunity for training highly qualified personnel on cutting-edge networking and distributed systems**technology.
Google分布式系统被设计成即使设备、机器和 ** 网络出现故障也能保持高可用性。网络分区故障带来了一个独特的挑战:它们是一些最 ** 复杂的处理故障,但不幸的是,它们越来越多地发生在现代数据中心。我们的目标是在五个广泛使用的模仿谷歌内部系统的生产质量系统中对网络分区相关故障进行深入的表征研究。我们的目标是更好地理解网络分区对现代分布式系统的影响,理解导致用户可见系统故障的特定事件序列,并描述这些系统故障,以确定提高系统容错能力的机会。我们计划使用我们的发现来设计网络分区测试 **(NPTest)框架,这是一个可以创建和修复网络分区的系统级测试框架。为了更广泛的影响,我们计划将NPTest开源。该项目描述了现代网络复杂故障的影响,并有可能对技术产生广泛的影响,包括建立网络规模系统的Google Canada。此外,对于 ** 数据中心(包括位于加拿大的200多个中心),该研究计划将提高各种系统的 ** 可靠性,并为广泛的云应用带来好处,包括医疗信息学、在线社交网络、人工智能和机器学习系统、智能能源分配系统和文本分析等领域的 ** 应用。最后,该计划将提供一个宝贵的机会,培训高素质的人员在尖端网络和分布式系统 ** 技术。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
AlKiswany, Samer其他文献
AlKiswany, Samer的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('AlKiswany, Samer', 18)}}的其他基金
Exploring a New Design Paradigm for Distributed Systems in Modern Data Centers
探索现代数据中心分布式系统的新设计范式
- 批准号:
RGPIN-2017-04180 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别:
Discovery Grants Program - Individual
Disaggregated Cloud
分解云
- 批准号:
537905-2018 - 财政年份:2021
- 资助金额:
$ 1.82万 - 项目类别:
Collaborative Research and Development Grants
Exploring a New Design Paradigm for Distributed Systems in Modern Data Centers
探索现代数据中心分布式系统的新设计范式
- 批准号:
RGPIN-2017-04180 - 财政年份:2021
- 资助金额:
$ 1.82万 - 项目类别:
Discovery Grants Program - Individual
Disaggregated Cloud
分解云
- 批准号:
537905-2018 - 财政年份:2020
- 资助金额:
$ 1.82万 - 项目类别:
Collaborative Research and Development Grants
Sequentially consistent reads at wire speed
以线速连续一致读取
- 批准号:
531857-2018 - 财政年份:2020
- 资助金额:
$ 1.82万 - 项目类别:
Collaborative Research and Development Grants
Exploring a New Design Paradigm for Distributed Systems in Modern Data Centers
探索现代数据中心分布式系统的新设计范式
- 批准号:
RGPIN-2017-04180 - 财政年份:2020
- 资助金额:
$ 1.82万 - 项目类别:
Discovery Grants Program - Individual
Exploring a New Design Paradigm for Distributed Systems in Modern Data Centers
探索现代数据中心分布式系统的新设计范式
- 批准号:
RGPIN-2017-04180 - 财政年份:2019
- 资助金额:
$ 1.82万 - 项目类别:
Discovery Grants Program - Individual
Disaggregated Cloud
分解云
- 批准号:
537905-2018 - 财政年份:2019
- 资助金额:
$ 1.82万 - 项目类别:
Collaborative Research and Development Grants
Sequentially consistent reads at wire speed
以线速连续一致读取
- 批准号:
531857-2018 - 财政年份:2019
- 资助金额:
$ 1.82万 - 项目类别:
Collaborative Research and Development Grants
Exploring a New Design Paradigm for Distributed Systems in Modern Data Centers
探索现代数据中心分布式系统的新设计范式
- 批准号:
RGPIN-2017-04180 - 财政年份:2018
- 资助金额:
$ 1.82万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
The Heterogenous Impact of Monetary Policy on Firms' Risk and Fundamentals
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
基于ImPACT方案的家长干预对孤独症谱系障碍儿童干预疗效及神经生物学机制研究
- 批准号:82301732
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
2型糖尿病胰岛β细胞功能调控新靶点IMPACT的功能及作用机制研究
- 批准号:81600598
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
基于IMPACT模型的社区慢性病干预效果的经济学评价研究
- 批准号:71303173
- 批准年份:2013
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Network for Integrated Care Excellence (NICE) Canada: Transforming Health with Integrated Care Knowledge Mobilization and Impact Hub
加拿大卓越综合护理网络 (NICE):通过综合护理知识动员和影响力中心改变健康状况
- 批准号:
485405 - 财政年份:2023
- 资助金额:
$ 1.82万 - 项目类别:
Operating Grants
Collaborative Research: Evaluating the Impact of the Promoting Active Learning and Mentoring (PALM) Network on Vision
协作研究:评估促进主动学习和指导 (PALM) 网络对视觉的影响
- 批准号:
2223276 - 财政年份:2023
- 资助金额:
$ 1.82万 - 项目类别:
Standard Grant
Network Connector: DEDICATE: Data Science Equity-Driven Inquiry to Create Accessible Project-based Training for Social Impact Education
网络连接器:DEDICATE:数据科学公平驱动的探究,为社会影响力教育创建可访问的基于项目的培训
- 批准号:
2304100 - 财政年份:2023
- 资助金额:
$ 1.82万 - 项目类别:
Continuing Grant
BCSER: IID: Using Social Network Analysis to Evaluate the Impact of Communities on Engineering Majors
BCSER:IID:利用社交网络分析评估社区对工程专业的影响
- 批准号:
2400680 - 财政年份:2023
- 资助金额:
$ 1.82万 - 项目类别:
Standard Grant
Collaborative Research: Evaluating the Impact of the Promoting Active Learning and Mentoring (PALM) Network on Vision
协作研究:评估促进主动学习和指导 (PALM) 网络对视觉的影响
- 批准号:
2223350 - 财政年份:2023
- 资助金额:
$ 1.82万 - 项目类别:
Standard Grant
The impact of alcohol use and alcohol-interactive toxicity beliefs on pre-exposure prophylaxis (PrEP) adherence among gay, bisexual, and other men who have sex with men: A social network approach
饮酒和酒精相互作用毒性信念对同性恋、双性恋和其他男男性行为者的暴露前预防 (PrEP) 依从性的影响:社交网络方法
- 批准号:
10538253 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别:
CRCNS US-French Research Proposal: Impact of network state on corticocortical communication
CRCNS 美法研究提案:网络状态对皮质通讯的影响
- 批准号:
2207707 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别:
Standard Grant
Using Integrative Data Analysis to Examine the Impact of Psychosocial Treatments for Black Cocaine Users Enrolled in the NIDA Drug Abuse Treatment Clinical Trials Network (CTN)
使用综合数据分析来检查心理社会治疗对参加 NIDA 药物滥用治疗临床试验网络 (CTN) 的黑色可卡因使用者的影响
- 批准号:
10683020 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别:
Resolving the impact of a human KCNQ3 mutation on mesostriatal dopamine connectivity and striatal network dynamics in social behavior
解决人类 KCNQ3 突变对社会行为中纹状体多巴胺连接和纹状体网络动态的影响
- 批准号:
10384357 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别:
Resolving the impact of a human KCNQ3 mutation on mesostriatal dopamine connectivity and striatal network dynamics in social behavior
解决人类 KCNQ3 突变对社会行为中纹状体多巴胺连接和纹状体网络动态的影响
- 批准号:
10594900 - 财政年份:2022
- 资助金额:
$ 1.82万 - 项目类别: