SHF: Small: Scalable Trace-Based Tools for In-Situ Data Analysis of HPC Applications (ScalaJack)

SHF:小型:用于 HPC 应用程序现场数据分析的可扩展的基于跟踪的工具 (ScalaJack)

基本信息

  • 批准号:
    1217748
  • 负责人:
  • 金额:
    $ 45.74万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-06-01 至 2017-05-31
  • 项目状态:
    已结题

项目摘要

Production codes on supercomputers are struggling to remain scalableeach time the processor core count increases by a factor of 10, eventhough they run efficiently at smaller scale.But root cause diagnosis fails at petascale since (1) symptoms ofperformance problems can be subtle, (2) only fewmetrics can be efficiently collected and (3) tools can only feasibly recorda small subset of even these metrics.This work addresses these problems by creating a framework that allowsapplication developers to focus on data analysis that drives customizeddata extraction combined with on-the-fly analysis specifically gearedto their individual problems. This is accomplished by combining traceanalysis and in-situ data analysis techniques at runtime, therebylifting data reduction to a new level where it IS analysis. With thisapproach, modular measurement and analysis components are combined toselectively extract representative data from production codes in aproblem-specific manner, which enables root cause analysis.The work demonstrates the feasibility of customized dataextraction and analysis at scale for root cause analysis on currentand forthcoming multi-petascale supercomputers. It thus contributesto sustain scalable scientific computing into the future up to the largestscales. Results of this work will be contributed as open-source codeto the research community and beyond as done, allowing other groups tonot only build tools on top of our framework but also contribute theirown components.
超级计算机上的生产代码很难保持可伸缩性-每次处理器核心计数增加10倍,即使它们在较小的规模下高效运行。但根本原因诊断在千万亿级失败,因为(1)性能问题的症状可能很微妙,(2)只能有效地收集几个指标,(3)工具只能可行地记录这些指标的一小部分。这项工作通过创建一个框架来解决这些问题,该框架允许应用程序开发人员专注于数据分析,以驱动定制的数据提取与特别针对他们的个别问题的动态分析。这是通过在运行时结合跟踪分析和现场数据分析技术来实现的,从而将数据简化提升到一个新的水平,在那里进行分析。该方法将模块化测量和分析组件结合起来,以特定问题的方式从生产代码中选择性地提取代表性数据,从而实现根本原因分析。该工作论证了定制数据提取和规模分析在当前和即将到来的数百亿级超级计算机上进行根本原因分析的可行性。因此,它有助于将可伸缩的科学计算支持到未来的最大规模。这项工作的结果将以开源代码的形式提供给研究社区,并以此为基础,允许其他团队不仅在我们的框架上构建工具,还可以贡献他们的开发组件。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Frank Mueller其他文献

C OPYRIGHTS AND C REATIVITY E VIDENCE FROM I TALIAN O PERA IN THE N APOLEONIC A GE *
拿破仑时代意大利歌剧院的版权和创造力证据*
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    B. Depoorter;Stephan Heblich;Sarah Kaplan;Frank Mueller;D. O’Reagan;F. Velde;Joel Waldfogel
  • 通讯作者:
    Joel Waldfogel
Parallel Trade and its Ambiguous Effects on Global Welfare
平行贸易及其对全球福利的模糊影响
  • DOI:
    10.1111/j.1467-9396.2011.01016.x
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Frank Mueller
  • 通讯作者:
    Frank Mueller
Trade, Competition and Welfare in Global Online Labour Markets: A 'Gig Economy' Case Study
全球在线劳动力市场的贸易、竞争和福利:“零工经济”案例研究
  • DOI:
    10.2139/ssrn.3090929
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Estrella Gomez;B. Martens;Frank Mueller
  • 通讯作者:
    Frank Mueller
Does Data Disclosure Increase Citations? Empirical Evidence from a Natural Experiment in Leading Economics Journals
数据披露会增加引用吗?
Making DRAM refresh predictable
  • DOI:
    10.1007/s11241-011-9129-6
  • 发表时间:
    2011-05-12
  • 期刊:
  • 影响因子:
    1.300
  • 作者:
    Balasubramanya Bhat;Frank Mueller
  • 通讯作者:
    Frank Mueller

Frank Mueller的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Frank Mueller', 18)}}的其他基金

Collaborative Research: PPoSS: Planning: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:规划:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2217020
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
EAGER: Curricula Development of a Quantum Programming Class with Hardware Access
EAGER:具有硬件访问功能的量子编程课程的课程开发
  • 批准号:
    1917383
  • 财政年份:
    2019
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Enhanced Security and Reliability for Embedded Control Systems
SaTC:CORE:小型:增强嵌入式控制系统的安全性和可靠性
  • 批准号:
    1813004
  • 财政年份:
    2018
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Student Travel Grant for RTSS'17 Ph.D. Student Poster Forum on Real-Time Aspects of Internet of Things and Cyber-Physical Systems
RTSS17 博士学生旅费补助金
  • 批准号:
    1744221
  • 财政年份:
    2017
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
CPS: Breakthrough: Collaborative Research: Bringing the Multicore Revolution to Safety-Critical Cyber-Physical Systems
CPS:突破:协作研究:为安全关键的网络物理系统带来多核革命
  • 批准号:
    1239246
  • 财政年份:
    2013
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: RESYST: Resilience via Synergistic Redundancy and Fault Tolerance for High-End Computing
SHF:小型:RESYST:通过协同冗余和容错实现高端计算的弹性
  • 批准号:
    1058779
  • 财政年份:
    2010
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
II-NEW: ARC: A Root Cluster for Research into Scalable Computer Systems
II-新:ARC:用于研究可扩展计算机系统的根集群
  • 批准号:
    0958311
  • 财政年份:
    2010
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: Providing Predictable Timing for Task Migration in Embedded Multi-Core Environments (TiME-ME)
CSR:中:协作研究:为嵌入式多核环境中的任务迁移提供可预测的时序 (TiME-ME)
  • 批准号:
    0905181
  • 财政年份:
    2009
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Continuing Grant
CSR--EHS: Collaborative Research: Hybrid Timing Analysis via Multi-Mode Execution
CSR--EHS:协作研究:通过多模式执行进行混合时序分析
  • 批准号:
    0720496
  • 财政年份:
    2007
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: Effective Detection and Alleviation of Scalability Problems
协作研究:有效检测和缓解可扩展性问题
  • 批准号:
    0429653
  • 财政年份:
    2004
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: QED - A New Approach to Scalable Verification of Hardware Memory Consistency
SHF:小型:QED - 硬件内存一致性可扩展验证的新方法
  • 批准号:
    2332891
  • 财政年份:
    2024
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2243053
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2243052
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
  • 批准号:
    2401274
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: A Distributed Scalable End-to-End Tail Latency SLO Guaranteed Resource Management Framework for Microservices
SHF:Small:分布式可扩展端到端尾部延迟 SLO 保证的微服务资源管理框架
  • 批准号:
    2226117
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: CT-DDS -- Scalable Concolic Testing of Parallel Applications With Shared Dynamic Data Structures
SHF:小型:CT-DDS——具有共享动态数据结构的并行应用程序的可扩展 Concolic 测试
  • 批准号:
    2226448
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
  • 批准号:
    2221811
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
  • 批准号:
    2221812
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: Scalable Formal Verification of ANN controlled Cyber-Physical Systems
SHF:小型:ANN 控制的网络物理系统的可扩展形式验证
  • 批准号:
    2008957
  • 财政年份:
    2020
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了