Error propagation analysis for GPGPU applications

GPGPU 应用程序的错误传播分析

基本信息

  • 批准号:
    489003-2015
  • 负责人:
  • 金额:
    $ 1.68万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Engage Grants Program
  • 财政年份:
    2015
  • 资助国家:
    加拿大
  • 起止时间:
    2015-01-01 至 2016-12-31
  • 项目状态:
    已结题

项目摘要

Hardware errors are increasing due to shrinking feature sizes and manufacturing variations. Conventional techniques to mask hardware errors from the software such as Dual Modular Redundancy are too expensive in terms of power consumption for commodity systems. Therefore, there is a critical need for software assisted techniques for handling hardware faults. This project will explore the use of software-based techniques for providing error resilience to applications running on Graphic Processing Units (GPUs), also known as GPGPU applications. GPUs are finding significant traction in accelerating applications in the data center and high-performance computing (HPC) space, where energy efficiency is vitally important. We will focus on errors that have the maximum impact on reliability to achieve both energy-efficiency and reliability. This research project will benefit Canada in three ways. First, NVIDIA (our industry partner) has an R&D presence in Toronto through a recent acquisition (30 engineers), and the proposed research is important for their long-term business needs. Second, this project lays the foundations of protecting general-purpose software applications from hardware errors. As hardware faults are expected to increase in future processor generations, it becomes essential to protect future software systems from hardware errors. The results of this research can thus be used in a number of critical domains such as aerospace, defence and bio-medical engineering. Finally, the students (HQP) involved in this project will be trained in the development of error resilience techniques for GPGPU applications, which are becoming more and more popular.
由于特征尺寸缩小和制造差异,硬件错误正在增加。常规 从软件中屏蔽硬件错误的技术(如Dual Modular Redundance)过于昂贵, 商品系统的功耗术语。因此,迫切需要软件辅助 处理硬件故障的技术。本项目将探索使用基于软件的技术, 为在图形处理单元(GPU)(也称为GPGPU)上运行的应用程序提供错误恢复能力 应用. GPU在加速数据中心的应用程序方面具有重要的吸引力, 高性能计算(HPC)空间,其中能效至关重要。我们将专注于 对可靠性有最大影响的错误,以实现能源效率和可靠性。 该研究项目将在三个方面使加拿大受益。首先,NVIDIA(我们的行业合作伙伴)拥有一个研发 通过最近的收购(30名工程师)在多伦多的存在,拟议的研究对于 他们的长期业务需求。第二,为通用软件的保护奠定了基础 应用程序的硬件错误。由于硬件故障预计在未来的处理器中会增加, 保护未来的软件系统免受硬件错误的影响变得至关重要。这项研究成果能 因此可用于航空航天、国防和生物医学工程等许多关键领域。最后, 参与该项目的学生(HQP)将接受错误恢复技术开发方面的培训, GPGPU应用程序,这是越来越受欢迎。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Pattabiraman, Karthik其他文献

Pattabiraman, Karthik的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Pattabiraman, Karthik', 18)}}的其他基金

Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    DGDND-2020-04644
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    RGPIN-2020-04644
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Discovery Grants Program - Individual
Automatic Secure Code Migration in the Heterogeneous World of Web of Things
物联网异构世界中的自动安全代码迁移
  • 批准号:
    535907-2018
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Collaborative Research and Development Grants
Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    DGDND-2020-04644
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    RGPIN-2020-04644
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Discovery Grants Program - Individual
Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    RGPIN-2020-04644
  • 财政年份:
    2020
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Discovery Grants Program - Individual
Resilient, Secure, and Programmable Next-Generation Internet of Things (IoT)
弹性、安全且可编程的下一代物联网 (IoT)
  • 批准号:
    DGDND-2020-04644
  • 财政年份:
    2020
  • 资助金额:
    $ 1.68万
  • 项目类别:
    DND/NSERC Discovery Grant Supplement
Automatic Secure Code Migration in the Heterogeneous World of Web of Things
物联网异构世界中的自动安全代码迁移
  • 批准号:
    535907-2018
  • 财政年份:
    2020
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Collaborative Research and Development Grants
Automatic Secure Code Migration in the Heterogeneous World of Web of Things
物联网异构世界中的自动安全代码迁移
  • 批准号:
    535907-2018
  • 财政年份:
    2019
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Collaborative Research and Development Grants
Building Error Resilient Software on Next Generation Computing Platforms
在下一代计算平台上构建容错软件
  • 批准号:
    RGPIN-2015-03767
  • 财政年份:
    2019
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

页岩超临界CO2压裂分形破裂机理与分形离散裂隙网络研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
拉压应力状态下含充填断续节理岩体三维裂隙扩展及锚杆加固机理研究
  • 批准号:
    40872203
  • 批准年份:
    2008
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

CRII: RI: TRUST—TRustworthy Uncertainty Propagation for Sequential Time-Series Analysis
CRII:RI:TRUST – 用于顺序时间序列分析的值得信赖的不确定性传播
  • 批准号:
    2401828
  • 财政年份:
    2023
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Standard Grant
CRII: RI: TRUST—TRustworthy Uncertainty Propagation for Sequential Time-Series Analysis
CRII:RI:TRUST – 用于顺序时间序列分析的值得信赖的不确定性传播
  • 批准号:
    2153413
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Standard Grant
The role of Alzheimer's disease GWAS risk factor BIN1 in tau neuropathology and propagation in vivo
阿尔茨海默病 GWAS 危险因子 BIN1 在 tau 神经病理学和体内传播中的作用
  • 批准号:
    10448676
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
NIH: Spatial Models of Intrahepatic Hepatitis Virus Propagation in Humans
NIH:人类肝内肝炎病毒传播的空间模型
  • 批准号:
    10565936
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
The Influence of Tau Post-Translational Modifications on the Propagation of Tau Pathology in Alzheimer's Disease
Tau 翻译后修饰对阿尔茨海默氏病 Tau 病理学传播的影响
  • 批准号:
    10676180
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
NIH: Spatial Models of Intrahepatic Hepatitis Virus Propagation in Humans
NIH:人类肝内肝炎病毒传播的空间模型
  • 批准号:
    10463188
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
Identification of novel four repeat tauopathies through analysis of network vulnerability, tau structure and propagation.
通过分析网络脆弱性、tau 结构和传播来识别新型四种重复 tau 病。
  • 批准号:
    10562726
  • 财政年份:
    2022
  • 资助金额:
    $ 1.68万
  • 项目类别:
General mechanism of the bend formation and propagation revealed by the analysis of insect sperm flagella
昆虫精子鞭毛分析揭示弯曲形成和传播的一般机制
  • 批准号:
    21H02455
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Analysis of crack propagation in heterogeneous rock masses under high temperature and high pressure conditions
高温高压条件下非均质岩体裂纹扩展分析
  • 批准号:
    21F21715
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Coordination and propagation of cell fate choice in neural circuit assembly
神经回路组装中细胞命运选择的协调和传播
  • 批准号:
    10418639
  • 财政年份:
    2021
  • 资助金额:
    $ 1.68万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了