SHF: Small: Solving the Problems of Scalability and Portability while Maximizing Performance of Multiprecision Scalar and Vector Arithmetic on Clusters of GPUs
SHF:小型:解决可扩展性和可移植性问题,同时最大限度地提高 GPU 集群上多精度标量和矢量算术的性能
基本信息
- 批准号:1525754
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-07-15 至 2019-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project extends the PI's prior research into achieving high performance for multiprecision arithmetic utilizing commodity graphics processors (GPUs). Multiprecision (MP) arithmetic has important applications in science, engineering, and mathematics when computations require greater numerical precision than standard computer systems support. It is also an important part of cryptography used in secure internet communication. GPUs can accelerate MP arithmetic by more than two orders of magnitude. However, achieving this performance requires novel algorithms and software tools. The world-record performance for exponentiation achieved under the prior grant will be extended to include floating point vector arithmetic. A new code generation model will enable handling a wider range of precisions across newer generations of graphics processors. Support for clusters of GPUs to work together on larger problems, and practical demonstrations of the effectiveness of MP library such as showing how one GPU can offload decryption work from more than a hundred servers, with higher levels of security than are currently in common use, is being developed. Each generation of GPU architecture requires extensive experimentation and reworking of multiprecision code to obtain a new optimum. Yet the potential benefits of a portable and scalable package could be transformational in certain application areas. This effort extends PI's prior work to include floating point and vectors, and begin the transition to GPU clusters. The result will be a publicly available multi-precision arithmetic package and implementation toolset that enables the scientific community to easily take full advantage of GPU scaling to obtain at least an order of magnitude improvement in performance per dollar and performance per watt over CPUs at the same technology step. The approach relies on a novel set of models for GPU storage that provide a higher level of abstraction over which the code generation tools can search for optimal combinations of algorithm, register/memory layout, and kernel launch geometry for a given precision size and GPU architectural generation to achieve maximum resource utilization.
该项目扩展了PI先前的研究,利用商品图形处理器(GPU)实现多精度算法的高性能。多精度(MP)算法在科学、工程和数学中有重要的应用,当计算需要比标准计算机系统支持更高的数值精度时。它也是用于安全互联网通信的密码学的重要组成部分。GPU可以将MP算法加速两个数量级以上。然而,实现这种性能需要新的算法和软件工具。在先前的授权下实现的幂运算的世界纪录性能将扩展到包括浮点向量运算。一个新的代码生成模型将使处理更广泛的精度在新一代的图形处理器。支持GPU集群在更大的问题上协同工作,以及MP库有效性的实际演示,例如展示一个GPU如何从100多个服务器卸载解密工作,其安全级别比目前常用的更高,正在开发中。每一代GPU架构都需要大量的实验和多精度代码的返工,以获得新的最佳效果。然而,便携式和可扩展的软件包的潜在好处在某些应用领域可能是变革性的。这项工作扩展了PI之前的工作,包括浮点和向量,并开始过渡到GPU集群。其结果将是一个公开的多精度算术包和实现工具集,使科学界能够轻松地充分利用GPU扩展,在相同的技术步骤中,与CPU相比,每美元的性能和每瓦的性能至少有一个数量级的提高。该方法依赖于一组新的GPU存储模型,这些模型提供了更高级别的抽象,代码生成工具可以在该抽象上搜索算法、寄存器/内存布局和内核启动几何结构的最佳组合,以实现给定精度大小和GPU架构生成的最大资源利用率。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Charles Weems其他文献
DPF-ECC: A Framework for Efficient ECC With Double Precision Floating-Point Computing Power
DPF-ECC:具有双精度浮点计算能力的高效 ECC 框架
- DOI:
10.1109/tifs.2021.3098987 - 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
高莉莉;郑昉昱;魏荣;董建阔;Niall Emmart;马原;林璟锵;Charles Weems - 通讯作者:
Charles Weems
Retrorectus prosthetic mesh repair of midline abdominal hernia.
直肠后肌假体网片修复腹部中线疝。
- DOI:
- 发表时间:
1997 - 期刊:
- 影响因子:3
- 作者:
D. Mclanahan;L. King;Charles Weems;Michael L. Novotney;K. Gibson - 通讯作者:
K. Gibson
The smallest eigenvalue of large Hankel matrices
- DOI:
10.1016/j.amc.2018.04.012 - 发表时间:
2018-10-01 - 期刊:
- 影响因子:
- 作者:
Mengkun Zhu;Yang Chen;Niall Emmart;Charles Weems - 通讯作者:
Charles Weems
Charles Weems的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Charles Weems', 18)}}的其他基金
Collaborative Research:CyberTraining:Implementation:Medium: Modern Course Exemplars infused with Parallel and Distributed Computing for the Introductory Computing Course Sequence
协作研究:网络培训:实施:中:为入门计算课程序列注入并行和分布式计算的现代课程范例
- 批准号:
2321016 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research:CyberTraining: Implementation: Medium:Broadening Adoption of Parallel and Distributed Computing in Undergraduate Computer Science and Engineering Curricula
协作研究:网络培训:实施:中:在本科计算机科学与工程课程中扩大并行和分布式计算的采用
- 批准号:
2017427 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research:CyberTraining:Conceptualization: Planning a Sustainable Ecosystem for Incorporating Parallel and Distributed Computing into Undergraduate Education
合作研究:网络培训:概念化:规划可持续生态系统,将并行和分布式计算纳入本科教育
- 批准号:
1924023 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CyberTraining: CDL: Preparing Instructors to Offer Experimental Courses in an Updated PDC Curriculum, and Broadening Participation
协作研究:网络培训:CDL:准备教师在更新的 PDC 课程中提供实验课程,并扩大参与范围
- 批准号:
1730527 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Workshop for Updating and Broadening the Parallel and Distributed Computing Curriculum in Undergraduate Education; Arlington, VA, August 17-18, 2015
更新和扩展本科教育并行和分布式计算课程研讨会;
- 批准号:
1546086 - 财政年份:2015
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
EAGER: Collaborative Research: Developing a Parallel and Distributed Computing Concepts Curriculum Enhancement for the Computer Science Principles Course
EAGER:协作研究:为计算机科学原理课程开发并行和分布式计算概念课程增强
- 批准号:
1550794 - 财政年份:2015
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF:Small: Solving the Problem of Scalable Multi-Precision Matrix Arithmetic on GPUs
SHF:Small:解决 GPU 上可扩展多精度矩阵算术问题
- 批准号:
1217590 - 财政年份:2012
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CI-ADDO-NEW: Parallel and Distributed Computing Curriculum Development and Educational Resources
合作研究:CI-ADDO-NEW:并行和分布式计算课程开发和教育资源
- 批准号:
1205492 - 财政年份:2012
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
AF: Small: RUI: Toward High-Performance Block Krylov Subspace Algorithms for Solving Large-Scale Linear Systems
AF:小:RUI:用于求解大规模线性系统的高性能块 Krylov 子空间算法
- 批准号:
2327619 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF: Small: Efficient, Deterministic and Formally Certified Methods for Solving Low-dimensional Linear Programs with Floating-point Precision
SHF:小型:用于以浮点精度求解低维线性程序的高效、确定性且经过正式认证的方法
- 批准号:
2312220 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF: Small: Solving the Parallel Functional Programming Challenge
SHF:小型:解决并行函数式编程挑战
- 批准号:
2115104 - 财政年份:2021
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: Solving and Simplifying Algebraic, Differential, and Difference Equations.
AF:小:求解和简化代数方程、微分方程和差分方程。
- 批准号:
2007959 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF: Small: MaPaMaP: Massively Parallel Solving of Math Problems
SHF:小型:MaPaMaP:数学问题的大规模并行解决
- 批准号:
2006363 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF: Small: MaPaMaP: Massively Parallel Solving of Math Problems
SHF:小型:MaPaMaP:数学问题的大规模并行解决
- 批准号:
1813993 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
RI: Small: Applying discrete reasoning steps in solving natural language processing tasks
RI:小:应用离散推理步骤解决自然语言处理任务
- 批准号:
1814522 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Design of support measures based on a mechanism that balances management problem solving and green management of small and medium-sized enterprises
基于中小企业管理问题解决与绿色管理平衡机制的支持措施设计
- 批准号:
18K11764 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CSR: Small: Heterogeneous Storage Systems with Emerging Technologies for Solving Big Data Problems
CSR:小型:利用新兴技术解决大数据问题的异构存储系统
- 批准号:
1812537 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: Algorithms for Solving Real-Life Instances of Optimization and Clustering Problems
AF:小:解决现实生活中优化和聚类问题实例的算法
- 批准号:
1718820 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Standard Grant














{{item.name}}会员




