Collaborative Research: PPoSS: Large: A comprehensive framework for efficient, scalable, and performance-portable tensor applications

协作研究:PPoSS:大型:高效、可扩展和性能可移植的张量应用程序的综合框架

基本信息

  • 批准号:
    2217089
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-07-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

Computations on tensors are fundamental to many large-scale parallel software applications in scientific computing and machine learning, and their efficient implementation has been crucial for the significant advances they have enabled. However, with the end of Moore’s Law, two critical challenges now threaten continued progress: (1) with transistors becoming a bounded resource, hardware customization is critical to sustaining improved performance and energy efficiency, requiring advances in algorithm-architecture co-design methodology; (2) increasing customization and heterogeneity of hardware architectures aggravates the already daunting challenges of application-developer productivity and performance-portability of software. This project brings together researchers with expertise spanning the algorithm/software/hardware stack to address these challenges. The project’s impacts include (1) improved performance and energy efficiency of hardware architectures through algorithm-architecture co-design; (2) increased developer productivity for software applications and the performance achieved on a variety of target platforms, which enhances the benefits of computing technology in science and industry; (3) advances in scalable machine-learning and scientific computing applications.The project makes contributions along multiple directions: (1) compiler optimization: powerful unified methodology for automated optimization of dense tensor computations, based on non-linear cost models for multi-level hyper-rectangular tiled execution on a range of target computing platforms; (2) scalability with sparsity: multi-level blocking methodology to enhance scalability of sparse-tensor computations, based on analysis of the intrinsic sparsity patterns of the data and the corresponding data-reuse patterns; (3) algorithm-architecture co-design: by leveraging new cost models, development of powerful and general new approaches for hardware-software co-design of accelerators for dense- and sparse-tensor computations; (4) correctness and accuracy: development of techniques to ensure correctness and floating-point accuracy with compiler transformations and compiler/hardware design-space exploration; (5) applications: use of the developed methodology and tools to advance cutting-edge applications in machine learning and scientific computing, including PDE solvers, quantum many-body simulation, tensor networks in machine learning, and large-scale image analysis.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
张量的计算对于科学计算和机器学习中的许多大规模并行软件应用至关重要,并且它们的有效实施对于它们启用的重大进展至关重要。但是,随着摩尔定律的终结,现在有两个关键挑战威胁到持续的进展:(1)随着晶体管成为有限的资源,硬件定制对于持续提高的性能和能源效率至关重要,需要在算法 - 建筑构造共同设计方法方面取得进步; (2)增加硬件体系结构的自定义和异质性加剧了应用程序开发者生产率和软件的性能通货性的挑战。该项目将跨越算法/软件/硬件堆栈的专业知识的研究人员汇集在一起​​,以应对这些挑战。该项目的影响包括(1)通过算法建筑共同设计提高了硬件体系结构的性能和能源效率; (2)提高了软件应用程序的开发人员生产率以及在各种目标平台上的性能,从而提高了计算技术在科学和行业中的好处; (3)可扩展的机器学习和科学计算应用程序的进步。该项目按多个方向做出了贡献:(1)编译器优化:基于多层超级高矩形瓷砖执行的非线性成本模型的强大统一方法,用于对密度张量计算的自动优化进行自动化,该方法是在目标计算平台上执行的; (2)具有稀疏性的可伸缩性:基于对数据的固有稀疏模式的分析以及相应的数据恢复模式,以增强稀疏量计算的可扩展性的多级阻止方法; (3)算法 - 建筑结构共同设计:通过利用新的成本模型,开发强大而一般的新方法,用于为加速器的硬件 - 软件共同设计,以进行密集和稀疏张量计算; (4)正确性和准确性:通过编译器转换以及编译器/硬件设计空间探索来确保正确性和浮点精度的技术开发; (5)应用:使用开发的方法和工具在机器学习和科学计算中提高了最先进的应用,包括PDE求解器,量子多体型模拟,机器学习中的张量网络以及大规模的图像分析。这项奖项反映了NSF的立法任务,并通过使用基础的智力评估诚实地评估了NSF的立法任务,并诚实地对基础的智力进行了评估。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Martin Kong其他文献

Efficient Cache Simulation for Affine Computations
仿射计算的高效缓存模拟
  • DOI:
    10.1007/978-3-030-35225-7_6
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wenlei Bao;P. Rawat;Martin Kong;S. Krishnamoorthy;L. Pouchet;P. Sadayappan
  • 通讯作者:
    P. Sadayappan
Remote Sensing of Wildfires
野火遥感
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    B. Leblon;J. San;L. Bourgeau;Martin Kong
  • 通讯作者:
    Martin Kong
Benchmarking and Evaluating Unified Memory for OpenMP GPU Offloading
OpenMP GPU 卸载的统一内存基准测试和评估
PIPES: A Language and Compiler for Task-Based Programming on Distributed-Memory Clusters
PIPES:分布式内存集群上基于任务的编程语言和编译器
Automatic Generation of Multi-Objective Polyhedral Compiler Transformations
自动生成多目标多面体编译器变换

Martin Kong的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Martin Kong', 18)}}的其他基金

Collaborative Research: PPoSS: Large: A comprehensive framework for efficient, scalable, and performance-portable tensor applications
协作研究:PPoSS:大型:高效、可扩展和性能可移植的张量应用程序的综合框架
  • 批准号:
    2234376
  • 财政年份:
    2022
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant

相似国自然基金

支持二维毫米波波束扫描的微波/毫米波高集成度天线研究
  • 批准号:
    62371263
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
腙的Heck/脱氮气重排串联反应研究
  • 批准号:
    22301211
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
水系锌离子电池协同性能调控及枝晶抑制机理研究
  • 批准号:
    52364038
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于人类血清素神经元报告系统研究TSPYL1突变对婴儿猝死综合征的致病作用及机制
  • 批准号:
    82371176
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FOXO3 m6A甲基化修饰诱导滋养细胞衰老效应在补肾法治疗自然流产中的机制研究
  • 批准号:
    82305286
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: PPoSS: Large: A Full-stack Approach to Declarative Analytics at Scale
协作研究:PPoSS:大型:大规模声明性分析的全栈方法
  • 批准号:
    2316161
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Collaborative Research: PPoSS: LARGE: Research into the Use and iNtegration of Data Movement Accelerators (RUN-DMX)
协作研究:PPoSS:大型:数据移动加速器 (RUN-DMX) 的使用和集成研究
  • 批准号:
    2316176
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Collaborative Research: PPoSS: Large: A Full-stack Approach to Declarative Analytics at Scale
协作研究:PPoSS:大型:大规模声明性分析的全栈方法
  • 批准号:
    2316158
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Collaborative Research: PPoSS: LARGE: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:LARGE:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2316201
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: LARGE: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:LARGE:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2316203
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了