CAREER: Application-centric, Reliable and Efficient High Performance Computing

职业:以应用为中心、可靠且高效的高性能计算

基本信息

  • 批准号:
    1553645
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-02-01 至 2023-01-31
  • 项目状态:
    已结题

项目摘要

Mission-critical scientific simulations (e.g., climate simulation and fluid dynamics simulation) and enterprise workloads (e.g., search and encryption) running on large-scale computing systems are jeopardized by the increase of faults and errors in hardware and software. Understanding the vulnerability of these large-scale applications is important to minimize performance and power. Lack of the knowledge of application vulnerability forms a major bottleneck of execution efficiency, and jeopardizes HPC simulation capabilities. Previous works rely on random fault injection or detailed architecture analysis to evaluate application vulnerability. They can be slow and inaccurate. There is a big gap between the needs of reliable and efficient HPC and what the current methodologies can provide. This research explores a new methodology to understand application vulnerability. It investigates new analytical and statistical models to quantify and characterize application vulnerability based on a novel metric and application semantics (including algorithm semantics and data semantics). The PI integrates modeling techniques into a broader context for vulnerability analysis to improve the modeling accuracy and explore reliable and efficient protection for applications while examine the interplay between reliability, power, and performance.The outcome from this research will provide support for execution correctness and efficiency of large-scale applications running on future computing systems that demand high data integrity. The proposed research will affect design of reliable applications and algorithms. Built upon the collaboration with industry, the research outcome is expected to be tangible and have direct impact on realistic scientific problems. Furthermore, the tight coupling between research components and education components creates a HPC learning culture to engage students in HPC, addressing HPC workforce shortage in the nation.
在大规模计算系统上运行的关键任务科学模拟(例如,气候模拟和流体动力学模拟)和企业工作负荷(例如,搜索和加密)由于硬件和软件中的故障和错误的增加而受到危害。了解这些大规模应用程序的漏洞对于最大限度地降低性能和功耗非常重要。缺乏对应用程序漏洞的了解是影响执行效率的主要瓶颈,并危及HPC模拟能力。以前的工作依赖于随机错误注入或详细的体系结构分析来评估应用程序漏洞。它们可能很慢,也不准确。在可靠和高效的高性能计算的需求与当前方法所能提供的之间存在很大差距。这项研究探索了一种了解应用程序漏洞的新方法。它基于一种新的度量和应用语义(包括算法语义和数据语义),研究新的分析和统计模型来量化和表征应用漏洞。PI将建模技术融入到更广泛的脆弱性分析环境中,以提高建模的准确性,探索对应用程序可靠而高效的保护,同时考察可靠性、功耗和性能之间的相互影响,为运行在未来对数据完整性要求较高的计算系统上的大规模应用程序的执行正确性和效率提供支持。拟议的研究将影响可靠的应用程序和算法的设计。在与工业界合作的基础上,研究成果预计将是有形的,并对现实的科学问题产生直接影响。此外,研究部分和教育部分之间的紧密结合创造了一种HPC学习文化,以吸引学生参与HPC,解决全国HPC劳动力短缺的问题。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Lobster: Load Balance-Aware I/O for Distributed DNN Training
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dong Li其他文献

Video motion tracking using enhanced particle filtering with Mean-shift
使用均值漂移增强粒子滤波进行视频运动跟踪
Negative selection algorithm with constant detectors for anomaly detection
用于异常检测的具有常量检测器的负选择算法
  • DOI:
    10.1016/j.asoc.2015.08.011
  • 发表时间:
    2015-11
  • 期刊:
  • 影响因子:
    8.7
  • 作者:
    Dong Li;Shulin Liu;Hongli Zhang
  • 通讯作者:
    Hongli Zhang
Single production of vector-like bottom quark at the LHeC
LHeC 中单次产生类矢量底夸克
  • DOI:
    10.1140/epjc/s10052-020-8424-6
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    4.4
  • 作者:
    Xue Gong;Chong-Xing Yue;Hai-Mei Yu;Dong Li
  • 通讯作者:
    Dong Li
Research on Self-Adaptive Algorithm of Transient Performance Analysis for DC Electronic Instrument Transformer Calibration
直流电子互感器检定暂态性能分析自适应算法研究
span style=font-family:quot;Times New Romanquot;,quot;serifquot;;font-size:10.5pt;A wind tunnel experimental study on burning rate enhancement behavior of gasoline pool fires by cross air flow/span
横向气流增强汽油池火灾燃烧速率行为的风洞实验研究
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    4.4
  • 作者:
    Longhua Hu;Shuai Liu;Yong Xu;Dong Li
  • 通讯作者:
    Dong Li

Dong Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dong Li', 18)}}的其他基金

IUCRC Preliminary Proposal Planning Grant UC Merced: Center for Memory System Research (CEMSYS)
IUCRC 初步提案规划拨款 加州大学默塞德分校:内存系统研究中心 (CEMSYS)
  • 批准号:
    2310919
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: LARGE: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:LARGE:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2316202
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: Planning: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:规划:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2217086
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF Student Travel Support for 2022 ACM Symposium on High-Performance Parallel and Distributed Computing (ACM HPDC)
NSF 学生为 2022 年 ACM 高性能并行和分布式计算研讨会 (ACM HPDC) 提供旅行支持
  • 批准号:
    2230513
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: SciMem: Enabling High Performance Multi-Scale Simulation on Big Memory Platforms
协作研究:要素:SciMem:在大内存平台上实现高性能多尺度仿真
  • 批准号:
    2104116
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF Student Travel Support for 2019 ACM Symposium on High-Performance Parallel and Distributed Computing (ACM HPDC)
NSF 学生旅行支持 2019 年 ACM 高性能并行和分布式计算研讨会 (ACM HPDC)
  • 批准号:
    1928873
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Student Travel Support for ACM High-Performance Parallel and Distributed Computing (HPDC) 2018
2018 年 ACM 高性能并行和分布式计算 (HPDC) 学生差旅支持
  • 批准号:
    1803286
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CCF:Small:Collaborative Research: Taowu: A Heterogeneous Processing-in-Memory for High Performance Scientific Applications
CCF:Small:合作研究:Taowu:用于高性能科学应用的异构内存处理
  • 批准号:
    1718194
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Exploring Portable Data Placement on Massively Parallel Platforms with Heterogeneous Memory Architectures
CSR:小型:协作研究:探索具有异构内存架构的大规模并行平台上的便携式数据放置
  • 批准号:
    1617967
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Overseas Travel Grant for a Maritime Logistics Symposium and a Research Visit at Shanghai
为海上物流研讨会和上海考察访问提供海外旅费资助
  • 批准号:
    EP/I005137/1
  • 财政年份:
    2010
  • 资助金额:
    $ 50万
  • 项目类别:
    Research Grant

相似国自然基金

Graphon mean field games with partial observation and application to failure detection in distributed systems
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于Kano模型的心脏外科患者术前访视移动应用程序的构建及应用研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
应用程序的未授权麦克风访问行为分析与防护方法研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于卷积神经网络建立中药材自动识别的人工智能模型及应用程序
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于多模态数据源的慢性病管理应用程序用户个性化激励机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
软件定义网络中应用程序安全性研究
  • 批准号:
    2021JJ40541
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
慢性病移动医疗应用程序用户激励机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
从API到NLI(自然语言接口)的软件复用技术研究
  • 批准号:
    61972006
  • 批准年份:
    2019
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
移动应用程序的安全类型系统
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
面向Web应用程序开发过程的漏洞在线预警分析研究
  • 批准号:
    61802332
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

REU Site: Software Dependability Centric Research and Application
REU 站点:以软件可靠性为中心的研究和应用
  • 批准号:
    2349347
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Application of Distributed Hash Concept to Route Finding in Information Centric Networking
分布式哈希概念在信息中心网络路由查找中的应用
  • 批准号:
    22K12019
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134202
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134203
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
My Health Wallet (MHW) - A Patient Centric Mobile Application To Securely Hold and Transmit Medical Data.
我的健康钱包 (MHW) - 一款以患者为中心的移动应用程序,用于安全保存和传输医疗数据。
  • 批准号:
    44723
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Study
A disruptive data-centric end-to-end requirements planning and automated verification platform - Continuity Application
颠覆性的以数据为中心的端到端需求规划和自动化验证平台 - 连续性应用
  • 批准号:
    72204
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Feasibility Studies
A randomised controlled trial of a comprehensive smartphone application-centric model of care to improve outcomes in patients with cardiovascular disease
一项以智能手机应用为中心的综合护理模式的随机对照试验,旨在改善心血管疾病患者的预后
  • 批准号:
    nhmrc : GNT1169673
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Postgraduate Scholarships
CPS: Synergy: Collaborative Research: Trustworthy Composition of Dynamic App-Centric Architectures for Medical Application Platforms
CPS:协同:协作研究:医疗应用平台以应用程序为中心的动态架构的值得信赖的组合
  • 批准号:
    1239324
  • 财政年份:
    2012
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CPS: Synergy: Collaborative Research: Trustworthy Composition of Dynamic App-Centric Architectures for Medical Application Platforms
CPS:协同:协作研究:医疗应用平台以应用程序为中心的动态架构的值得信赖的组合
  • 批准号:
    1239543
  • 财政年份:
    2012
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Application-Centric Checkable Enablement of Privacy and Trust (ACCEPT)
以应用程序为中心的可检查隐私和信任启用 (ACCEPT)
  • 批准号:
    311524-2004
  • 财政年份:
    2005
  • 资助金额:
    $ 50万
  • 项目类别:
    Idea to Innovation
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了