Optimization Techniques and Language Abstractions for GPGPU in Ruby
Ruby 中 GPGPU 的优化技术和语言抽象
基本信息
- 批准号:18J14726
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-25 至 2020-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Our research was centered around bringing fast object-oriented programming (OOP) to GPUs. We improved our previously developed CUDA framework "DynaSOAr". One of DynaSOAr's main components is a dynamic memory manager for object-oriented Single-Method Multiple-Objects (SMMO) applications.The main improvement to DynaSOAr was "CompactGpu", a memory defragmentation system. CompactGpu can improve the performance of memory-bound GPU applications by storing allocations in a denser format. CompactGpu physically rearranges objects in memory, so that they are stored in few, compact blocks of memory. With dynamic memory allocation, such fragmentation is often caused by unfavorable allocate-deallocate pattern.Memory defragmentation proved to be particularly useful for two kinds of applications: (1) Applications that use only a small amount of memory and fit largely into the L1/L2 cache if stored densely. (2) Applications that already benefit from a Structure of Array (SOA) memory layout get even faster, because vector load/stores are more efficient if data is stored in a compact form. Our work, published at ISMM 2019, achieved a speedup of up to 16% in our benchmark applications.
我们的研究主要集中在将快速面向对象编程(OOP)引入GPU上。我们改进了我们以前开发的CUDA框架“DynaSOAr”。DynaSOAr的主要组件之一是面向对象的单方法多对象(SMMO)应用程序的动态内存管理器。DynaSOAr的主要改进是“CompactGpu”,一个内存碎片整理系统。CompactGPU可以通过以更密集的格式存储分配来提高内存受限的GPU应用程序的性能。CompactGpu在物理上重新排列内存中的对象,使它们存储在几个紧凑的内存块中。在动态内存分配中,内存碎片往往是由分配-释放模式引起的,内存碎片整理对两类应用特别有用:(1)内存占用量小,如果存储密度大,可以放入L1/L2 Cache的应用。(2)已经受益于阵列结构(SOA)内存布局的应用程序甚至更快,因为如果数据以紧凑的形式存储,则向量加载/存储更有效。我们的工作发表在ISMM 2019上,在我们的基准测试应用程序中实现了高达16%的加速。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DynaSOAr: A Parallel Memory Allocator for Object-Oriented Programming on GPUs with Efficient Memory Access (Artifact)
DynaSOAr:一种并行内存分配器,用于在 GPU 上进行面向对象编程,具有高效的内存访问(Artifact)
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Matthias Springer;Hidehiko Masuhara
- 通讯作者:Hidehiko Masuhara
Inner array inlining for structure of arrays layout
数组布局结构的内部数组内联
- DOI:10.1145/3219753.3219760
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Matthias Springer;Yaozhu Sun;Hidehiko Masuhara
- 通讯作者:Hidehiko Masuhara
DynaSOAr: A parallel memory allocator for object-oriented programming on GPUs with efficient memory access
DynaSOAr:一种并行内存分配器,用于在 GPU 上进行面向对象编程,具有高效的内存访问能力
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Jeanine Miller Adkisson;Johannes Westlund;Hidehiko Masuhara;Matthias Springer and Hidehiko Masuhara;Matthias Springer and Hidehiko Masuhara
- 通讯作者:Matthias Springer and Hidehiko Masuhara
CompactGpu: Massively Parallel Memory Defragmentation on GPUs
CompactGpu:GPU 上的大规模并行内存碎片整理
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Matthias Springer;Yaozhu Sun;Hidehiko Masuhara;Matthias Springer;Matthias Springer;Matthias Springer
- 通讯作者:Matthias Springer
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
SPRINGER MATTHIAS其他文献
SPRINGER MATTHIAS的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
基于GPUs的四原子非绝热反应量子态分辨的散射动力学研究
- 批准号:11704160
- 批准年份:2017
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
基于GPUs的三原子碰撞量子态态动力学非绝热效应研究
- 批准号:11504206
- 批准年份:2015
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
RII Track-4:NSF: Continental-scale, high-order, high-spatial-resolution, ice flow modeling based on graphics processing units (GPUs)
RII Track-4:NSF:基于图形处理单元 (GPU) 的大陆尺度、高阶、高空间分辨率冰流建模
- 批准号:
2327095 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant
Fully general-relativistic magneto-hydrodynamic simulations beyond Relativity with GPUs
使用 GPU 进行超越相对论的完全广义相对论磁流体动力学模拟
- 批准号:
ST/Z000424/1 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Research Grant
Collaborative Research: CSR: Medium: Architecting GPUs for Practical Homomorphic Encryption-based Computing
协作研究:CSR:中:为实用的同态加密计算构建 GPU
- 批准号:
2312276 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Continuing Grant
CRII: SHF: Expediting Subgraph Matching on GPUs
CRII:SHF:加快 GPU 上的子图匹配
- 批准号:
2331536 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant
CSR: Small: A Fine-Grained Hierarchical Memory Management System for Applications with Dynamic Memory Demand on GPUs
CSR:小型:针对 GPU 上具有动态内存需求的应用程序的细粒度分层内存管理系统
- 批准号:
2311610 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Continuing Grant
CAREER: An Algorithm and System Co-Designed Framework for Graph Sampling and Random Walk on GPUs
职业生涯:用于 GPU 上的图形采样和随机游走的算法和系统协同设计框架
- 批准号:
2326141 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Continuing Grant
CRII: SHF: A Parallel and Distributed Framework for Graph Mining on GPUs
CRII:SHF:GPU 上图挖掘的并行分布式框架
- 批准号:
2245792 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant
CC* Regional Computing: Great Plains Extended Network of GPUs for Interactive Experimenters (GP-ENGINE)
CC* 区域计算:用于交互式实验者的 Great Plains GPU 扩展网络 (GP-ENGINE)
- 批准号:
2322218 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant
Collaborative Research: CSR: Medium: Architecting GPUs for Practical Homomorphic Encryption-based Computing
协作研究:CSR:中:为实用的同态加密计算构建 GPU
- 批准号:
2312275 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Continuing Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
- 批准号:
2153749 - 财政年份:2022
- 资助金额:
$ 0.96万 - 项目类别:
Standard Grant