SHF: Small: Tools for Productive High-performance Computing with GPUs
SHF:小型:使用 GPU 进行高效高性能计算的工具
基本信息
- 批准号:2018016
- 负责人:
- 金额:$ 41.61万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-08 至 2023-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Graphical Processing Units (GPUs) are widely and cheaply available and have become increasingly powerful relative to general-purpose CPUs. Therefore, they are attractive targets for compute-intensive applications in computational science and data science. However, development of software to run on GPUs is time-consuming and requires expertise held by only a very small fraction of the application developer community. This project is developing a collection of tools to assist in the productive development of high-performance software for GPUs, so that the barrier to effective use of GPUs by the scientific community can be lowered.A central idea being pursued in this research is the identification of primary hardware resource bottlenecks that limit performance of a GPU kernel, to guide the modification of the kernel in a manner that seeks to alleviate the identified bottleneck. Abstract kernel emulation along with sensitivity analysis with respect to hardware resource latency/throughput parameters are used for bottleneck identification. Three usage scenarios are targeted: (1) OpenMP offload, (2) domain-specific code generators, and (3) CUDA/OpenCL kernels. The offload model introduced in OpenMP 4.0 is an attractive approach for transforming existing legacy codes as well as for newly developed codes, to facilitate productivity and portability. Domain-specific library generators exploit pattern-specific semantics in order to perform optimizing transformations that are beyond the scope of general-purpose optimizing compilers. Tensor contractions and stencils are two domains of particular emphasis. For all targeted usage scenarios, the collection of tools is intended to assist developers improve the performance of GPU code through a combination of model-driven search and auto-tuning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
图形处理单元(GPU)广泛且廉价可用,并且相对于通用CPU已经变得越来越强大。因此,它们是计算科学和数据科学中计算密集型应用的有吸引力的目标。然而,在GPU上运行的软件的开发是耗时的,并且只需要应用程序开发人员社区的一小部分人拥有的专业知识。该项目正在开发一系列工具,以帮助GPU高性能软件的生产性开发,从而降低科学界有效使用GPU的障碍。本研究的中心思想是识别限制GPU内核性能的主要硬件资源瓶颈,以寻求缓解所识别的瓶颈的方式来指导内核的修改。抽象内核仿真沿着与硬件资源延迟/吞吐量参数相关的灵敏度分析用于瓶颈识别。三种使用场景是针对的:(1)OpenMP卸载,(2)特定于域的代码生成器,和(3)CUDA/OpenCL内核。 OpenMP4.0中引入的卸载模型是一种有吸引力的方法,可用于转换现有的遗留代码以及新开发的代码,以提高生产力和可移植性。特定于域的库生成器利用特定于模式的语义来执行超出通用优化编译器范围的优化转换。张量收缩和张量扩张是特别强调的两个领域。对于所有有针对性的使用场景,该工具集旨在帮助开发人员通过模型驱动搜索和自动调优相结合来提高GPU代码的性能。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响评审标准进行评估,被认为值得支持。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Automated derivation of parametric data movement lower bounds for affine programs
自动推导仿射程序的参数数据移动下限
- DOI:10.1145/3385412.3385989
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Olivry, Auguste;Langou, Julien;Pouchet, Louis-Noël;Sadayappan, P.;Rastello, Fabrice
- 通讯作者:Rastello, Fabrice
Analytical cache modeling and tilesize optimization for tensor contractions
- DOI:10.1145/3295500.3356218
- 发表时间:2019-11
- 期刊:
- 影响因子:0
- 作者:Rui Li;Aravind Sukumaran-Rajam;R. Veras;Tze Meng Low;F. Rastello;A. Rountev;P. Sadayappan
- 通讯作者:Rui Li;Aravind Sukumaran-Rajam;R. Veras;Tze Meng Low;F. Rastello;A. Rountev;P. Sadayappan
ALO-NMF: Accelerated Locality-Optimized Non-negative Matrix Factorization
- DOI:10.1145/3394486.3403227
- 发表时间:2020-07
- 期刊:
- 影响因子:0
- 作者:Gordon E. Moon;J. Austin Ellis;Aravind Sukumaran-Rajam;S. Parthasarathy;P. Sadayappan
- 通讯作者:Gordon E. Moon;J. Austin Ellis;Aravind Sukumaran-Rajam;S. Parthasarathy;P. Sadayappan
An efficient mixed-mode representation of sparse tensors
- DOI:10.1145/3295500.3356216
- 发表时间:2019-11
- 期刊:
- 影响因子:0
- 作者:Israt Nisa;Jiajia Li;Aravind Sukumaran-Rajam;Prasant Singh;Sri-ram Krishnamoorthy;P. Sadayappan;Singh Rawat;Sri-ram Krishnamoorthy;An Efficient Mixed-Mode
- 通讯作者:Israt Nisa;Jiajia Li;Aravind Sukumaran-Rajam;Prasant Singh;Sri-ram Krishnamoorthy;P. Sadayappan;Singh Rawat;Sri-ram Krishnamoorthy;An Efficient Mixed-Mode
IOOpt: automatic derivation of I/O complexity bounds for affine programs
IOOpt:自动推导仿射程序的 I/O 复杂度界限
- DOI:10.1145/3453483.3454103
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Olivry, Auguste;Iooss, Guillaume;Tollenaere, Nicolas;Rountev, Atanas;Sadayappan, P.;Rastello, Fabrice
- 通讯作者:Rastello, Fabrice
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ponnuswamy Sadayappan其他文献
Ponnuswamy Sadayappan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ponnuswamy Sadayappan', 18)}}的其他基金
Collaborative Research: PPoSS: Large: A Comprehensive Framework for Efficient, Scalable, and Performance-Portable Tensor Applications
合作研究:PPoSS:大型:高效、可扩展和性能可移植的张量应用的综合框架
- 批准号:
2217154 - 财政年份:2022
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
Collaborative Research: PPoSS: Planning: Model-Driven Compiler Optimization and Algorithm-Architecture Co-Design for Scalable Machine Learning
协作研究:PPoSS:规划:用于可扩展机器学习的模型驱动编译器优化和算法架构协同设计
- 批准号:
2119677 - 财政年份:2021
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
OAC: Small: Data Locality Optimization for Sparse Matrix/Tensor Computations
OAC:小型:稀疏矩阵/张量计算的数据局部性优化
- 批准号:
2009007 - 财政年份:2020
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
Collaborative Research: PPoSS: Planning: A Cross-Layer Observable Approach to Extreme Scale Machine Learning and Analytics
协作研究:PPoSS:规划:超大规模机器学习和分析的跨层可观察方法
- 批准号:
2028942 - 财政年份:2020
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
CDS&E: Compiler/Runtime Support for Developing Scalable Parallel Multi-Scale Multi-Physics
CDS
- 批准号:
1940789 - 财政年份:2019
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SPX: Collaborative Research: Parallel Algorithm by Blocks - A Data-centric Compiler/runtime System for Productive Programming of Scalable Parallel Systems
SPX:协作研究:块并行算法 - 用于可扩展并行系统的高效编程的以数据为中心的编译器/运行时系统
- 批准号:
1946752 - 财政年份:2019
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SPX: Collaborative Research: Parallel Algorithm by Blocks - A Data-centric Compiler/runtime System for Productive Programming of Scalable Parallel Systems
SPX:协作研究:块并行算法 - 用于可扩展并行系统的高效编程的以数据为中心的编译器/运行时系统
- 批准号:
1919211 - 财政年份:2019
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Tools for Productive High-performance Computing with GPUs
SHF:小型:使用 GPU 进行高效高性能计算的工具
- 批准号:
1816793 - 财政年份:2018
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
XPS: FULL: Collaborative Research: PARAGRAPH: Parallel, Scalable Graph Analytics
XPS:完整:协作研究:段落:并行、可扩展图形分析
- 批准号:
1629548 - 财政年份:2016
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
EAGER: Towards Automated Characterization of the Data-Movement Complexity of Large Scale Analytics Applications
EAGER:实现大规模分析应用程序数据移动复杂性的自动表征
- 批准号:
1645599 - 财政年份:2016
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
- 批准号:
2401274 - 财政年份:2023
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
- 批准号:
2221811 - 财政年份:2022
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
- 批准号:
2221812 - 财政年份:2022
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Programming Tools for Adaptive Data Analysis
SHF:小型:协作研究:自适应数据分析的编程工具
- 批准号:
2040222 - 财政年份:2020
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Provably Efficient Dynamic Analysis Tools for Task Parallel Computations
SHF:小型:可证明高效的任务并行计算动态分析工具
- 批准号:
1910568 - 财政年份:2019
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Science and Tools for Intelligent Developer Testing
SHF:小型:智能开发人员测试的科学和工具
- 批准号:
1816615 - 财政年份:2018
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Tools for Productive High-performance Computing with GPUs
SHF:小型:使用 GPU 进行高效高性能计算的工具
- 批准号:
1816793 - 财政年份:2018
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Models and Design Tools for Tethered Molecular Circuits
SHF:小型:系留分子电路的模型和设计工具
- 批准号:
1814906 - 财政年份:2018
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Programming Tools for Adaptive Data Analysis
SHF:小型:协作研究:自适应数据分析的编程工具
- 批准号:
1718088 - 财政年份:2017
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Programming Tools for Adaptive Data Analysis
SHF:小型:协作研究:自适应数据分析的编程工具
- 批准号:
1718220 - 财政年份:2017
- 资助金额:
$ 41.61万 - 项目类别:
Standard Grant