SHF: Small: Advanced Compiler Techniques for Meeting Fault Tolerance Needs of HPC Systems
SHF:小型:满足 HPC 系统容错需求的先进编译器技术
基本信息
- 批准号:1319420
- 负责人:
- 金额:$ 49.97万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-07-01 至 2017-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Making high performance applications resilient to failure of individual nodes is a major challenge today. Particularly, there is a need for reducing the overheads associated with checkpointing and for dealing with silent data corruption in an effective fashion. This project at Ohio State University is addressing these problems based on new insights and approaches. The work on improving the efficiency of checkpointing and restart is based on the following observation - current checkpointing protocols were developed in context of distributed computing, and do not exploit key properties seen in most scientific parallel programs. This project is developing static and dynamic analysis methods to determine what we refer to as the "message intent", which can then be used to allow automated application-level uncoordinated checkpointing, but without the need for message logging, keeping the checkpoint sizes small, and recovery low-cost. In addition, a distinct software approach for handling silent data corruption is being developed. The idea is to make the data structures that control what computation and/or communication occurs in the program resilient, by only replicating them and their storage. This introduces modest overheads, but guards against the most drastic impact of silent data corruption on program stability and correctness. This research will result in reducing overheads of making high performance systems resilient, which in turn will improve the efficiency and resource utilization.
使高性能应用程序能够抵御单个节点的故障是当今的一个主要挑战。 特别地,需要减少与检查点相关联的开销,并且需要以有效的方式处理无声数据损坏。 俄亥俄州州立大学的这个项目正在基于新的见解和方法来解决这些问题。 提高检查点和重启效率的工作基于以下观察-当前的检查点协议是在分布式计算的背景下开发的,并且不利用大多数科学并行程序中的关键属性。 该项目正在开发静态和动态分析方法,以确定我们所说的“消息意图”,然后可以使用该方法来允许自动化应用程序级非协调检查点,但不需要消息日志记录,保持检查点大小 小,回收成本低。 此外,正在开发一种用于处理静默数据损坏的独特软件方法。 这个想法是使控制程序中发生的计算和/或通信的数据结构具有弹性,只需复制它们及其存储。 这引入了适度的开销,但可以防止静默数据损坏对程序稳定性和正确性的最严重影响。这项研究将减少使高性能系统具有弹性的管理费用,从而提高效率和资源利用率。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Gagan Agrawal其他文献
MMIS-07, 08: Mining Multiple Information Sources Workshop Report
MMIS-07, 08:挖掘多信息源研讨会报告
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
朱兴全;Gagan Agrawal;Yuri Breitbart;Ruoming Jin - 通讯作者:
Ruoming Jin
Middleware for data mining applications on clusters and grids
- DOI:
10.1016/j.jpdc.2007.06.007 - 发表时间:
2008-01-01 - 期刊:
- 影响因子:
- 作者:
Leonid Glimcher;Ruoming Jin;Gagan Agrawal - 通讯作者:
Gagan Agrawal
<strong>POSTER:</strong> MDS-044 Cancer Disparities in Survival of Patients With Hematologic Malignancies in the Context of Social Determinants of Health: A Systematic Review
- DOI:
10.1016/s2152-2650(23)00577-3 - 发表时间:
2023-09-01 - 期刊:
- 影响因子:
- 作者:
Marisol Miranda-Galvis;Kellen Tjioe;Andrew Balas;Gagan Agrawal;Jorge Cortes - 通讯作者:
Jorge Cortes
Organizing Records for Retrieval in Multi-Dimensional Range Searchable Encryption
多维范围可搜索加密中组织检索记录
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Mahdieh Heidaripour;Ladan Kian;Maryam Rezapour;Mark Holcomb;Benjamin Fuller;Gagan Agrawal;Hoda Maleki - 通讯作者:
Hoda Maleki
The interaction between social determinants of health and cervical cancer survival: A systematic review
健康的社会决定因素与宫颈癌生存之间的相互作用:系统评价
- DOI:
10.1016/j.ygyno.2023.12.020 - 发表时间:
2024-02-01 - 期刊:
- 影响因子:4.100
- 作者:
Kellen Cristine Tjioe;Marisol Miranda-Galvis;Marian Symmes Johnson;Gagan Agrawal;E. Andrew Balas;Jorge E. Cortes - 通讯作者:
Jorge E. Cortes
Gagan Agrawal的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Gagan Agrawal', 18)}}的其他基金
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
- 批准号:
2230945 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
- 批准号:
2341378 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
OAC Core: SHF: SMALL: ICURE -- In-situ Analytics with Compressed or Summary Representations for Extreme-Scale Architectures
OAC 核心:SHF:SMALL:ICURE——针对超大规模架构的压缩或摘要表示的原位分析
- 批准号:
2333899 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
SHF: Small: K-Way Speculation for Mapping Applications with Dependencies on Modern HPC Systems
SHF:小型:依赖现代 HPC 系统的地图应用程序的 K-Way 推测
- 批准号:
2334273 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Collaborative Research: SHF:SMALL: Compile-Parallelize-Schedule-Retarget-Repeat (EASER) Paradigm for Dealing with Extreme Heterogeneity
合作研究:SHF:SMALL:处理极端异构性的编译-并行化-调度-重定向-重复 (EASER) 范式
- 批准号:
2333895 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Collaborative Research: SHF:SMALL: Compile-Parallelize-Schedule-Retarget-Repeat (EASER) Paradigm for Dealing with Extreme Heterogeneity
合作研究:SHF:SMALL:处理极端异构性的编译-并行化-调度-重定向-重复 (EASER) 范式
- 批准号:
2146852 - 财政年份:2022
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
OAC Core: SHF: SMALL: ICURE -- In-situ Analytics with Compressed or Summary Representations for Extreme-Scale Architectures
OAC 核心:SHF:SMALL:ICURE——针对超大规模架构的压缩或摘要表示的原位分析
- 批准号:
2007775 - 财政年份:2020
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
OAC Core: SHF: SMALL: ICURE -- In-situ Analytics with Compressed or Summary Representations for Extreme-Scale Architectures
OAC 核心:SHF:SMALL:ICURE——针对超大规模架构的压缩或摘要表示的原位分析
- 批准号:
2034850 - 财政年份:2020
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
SHF: Small: K-Way Speculation for Mapping Applications with Dependencies on Modern HPC Systems
SHF:小型:依赖于现代 HPC 系统的地图应用程序的 K-Way 推测
- 批准号:
2007793 - 财政年份:2020
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
II-New: Infrastructure for Energy-Aware High Performance Computing (HPC) and Data Analytics on Heterogeneous Systems
II-新:异构系统上的能源感知高性能计算 (HPC) 和数据分析基础设施
- 批准号:
1513120 - 财政年份:2015
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Phase Ib/II study of safety and efficacy of EZH2 inhibitor, tazemetostat, and PD-1 blockade for treatment of advanced non-small cell lung cancer
EZH2 抑制剂、他泽美司他和 PD-1 阻断治疗晚期非小细胞肺癌的安全性和有效性的 Ib/II 期研究
- 批准号:
10481965 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
SBIR Phase I: CAS: Advanced Thermal Oxidizer to Cost-effectively Control Greenhouse Emissions from Small Sources
SBIR 第一阶段:CAS:先进的热氧化器,可经济高效地控制小源温室气体排放
- 批准号:
2326861 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Defining mechanisms of blood-brain barrier dysfunction in cerebral small vessel disease using advanced 3D in vitro models.
使用先进的 3D 体外模型定义脑小血管疾病血脑屏障功能障碍的机制。
- 批准号:
MR/W027119/1 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Fellowship
Advanced machine learning to empower ultra-sensitive liquid biopsy in melanoma and non-small cell lung cancer
先进的机器学习使黑色素瘤和非小细胞肺癌的超灵敏液体活检成为可能
- 批准号:
10591304 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
SBIR Phase II: Accelerating R&D through Streamlined Machine Learning Algorithms for Small Data Applications in Advanced Manufacturing
SBIR 第二阶段:加速 R
- 批准号:
2325045 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Cooperative Agreement
Development of a novel small molecule RPN13 inhibitor and therapeutic for advanced ovarian cancer patients
开发新型小分子 RPN13 抑制剂和治疗晚期卵巢癌患者的药物
- 批准号:
10760824 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
CyberTraining: Implementation: Small: Infrastructure Cybersecurity Curriculum Development and Training for Advanced Manufacturing Research Workforce
网络培训:实施:小型:基础设施网络安全课程开发和先进制造研究人员培训
- 批准号:
2230025 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Advanced Small Animal Ultrasound Imaging - Vevo F2
先进的小动物超声成像 - Vevo F2
- 批准号:
10632878 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Impact of lower airway microbiota in advanced non-small cell lung cancer patients treated PD-1/PD-L1 blocade: A Biomarker Study
下呼吸道微生物群对接受 PD-1/PD-L1 抑制剂治疗的晚期非小细胞肺癌患者的影响:一项生物标志物研究
- 批准号:
22K20839 - 财政年份:2022
- 资助金额:
$ 49.97万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Establishment of radiotherapy technique to minimise the risk of radiation pneumonitis in locally advanced non-small cell lung cancer.
建立放射治疗技术,以尽量减少局部晚期非小细胞肺癌发生放射性肺炎的风险。
- 批准号:
22K20856 - 财政年份:2022
- 资助金额:
$ 49.97万 - 项目类别:
Grant-in-Aid for Research Activity Start-up