SHF: Small: Enabling Efficient Context Switching and Effective Latency Hiding in GPUs

SHF:小:在 GPU 中实现高效的上下文切换和有效的延迟隐藏

基本信息

  • 批准号:
    1618509
  • 负责人:
  • 金额:
    $ 33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-01 至 2019-07-31
  • 项目状态:
    已结题

项目摘要

Graphics processing units (GPUs), initially designed for computer graphics, are becoming widely used for general purpose computing. This project addresses two important challenges in GPU computing. First, it investigates schemes to enable GPUs to be preempted efficiently, which is critical for GPUs to satisfy the quality of service (QOS) requirement in the cloud environment. Second, the project looks into approaches to significantly improve the latency hiding capability of GPUs. This interdisciplinary research has two practical uses, efficient preemption empowering GPUs as truly shared resource and effective latency hiding improving both the GPU performance and energy efficiency. Graduate student advising and industry collaboration are two key aspects of the project.The design philosophy of GPUs is to exploit very high degrees of data-level parallelism (DLP), expressed as thread-level parallelism (TLP), to hide long instruction latency. As a side effect, GPUs feature high amounts of on-chip resources to store the contexts or the architectural states of the large numbers of concurrent threads. The large contexts result in long latency for context switching, which makes it difficult for GPUs to be truly shared in cloud servers. This research project leverages the nature of the single-instruction multiple-thread (SIMT) execution model to drastically reduce and compress the GPU context size. Software and hardware approaches are integrated to enable instruction-level preemption for GPUs to meet the QOS requirements. Fast context switching is also used to switch out stalled threads and switch in new ones such that the otherwise idle computing resources can be utilized to provide much higher latency-hiding capability. It essentially achieves higher TLP on GPUs without enlarging their critical on-chip resources.
图形处理单元 (GPU) 最初是为计算机图形设计的,现在正广泛用于通用计算。该项目解决了 GPU 计算中的两个重要挑战。首先,它研究了使 GPU 能够被有效抢占的方案,这对于 GPU 满足云环境中的服务质量 (QOS) 要求至关重要。其次,该项目研究了显着提高 GPU 延迟隐藏能力的方法。这项跨学科研究有两个实际用途:高效抢占使 GPU 成为真正的共享资源,以及有效的延迟隐藏提高 GPU 性能和能源效率。研究生建议和行业合作是该项目的两个关键方面。GPU 的设计理念是利用非常高程度的数据级并行性 (DLP),表示为线程级并行性 (TLP),以隐藏较长的指令延迟。副作用是,GPU 具有大量片上资源来存储大量并发线程的上下文或架构状态。大的上下文导致上下文切换的延迟很长,这使得GPU很难在云服务器中真正共享。该研究项目利用单指令多线程 (SIMT) 执行模型的性质来大幅减少和压缩 GPU 上下文大小。通过软硬件结合的方式,实现GPU指令级抢占,满足QOS要求。快速上下文切换还用于切换出停滞的线程并切换到新的线程,以便可以利用空闲的计算资源来提供更高的延迟隐藏能力。它本质上在 GPU 上实现了更高的 TLP,而无需扩大其关键的片上资源。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scatter-and-Gather Revisited: High-Performance Side-Channel-Resistant AES on GPUs
重新审视分散和聚集:GPU 上的高性能抗侧通道 AES
Coordinated CTA Combination and Bandwidth Partitioning for GPU Concurrent Kernel Execution
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Huiyang Zhou其他文献

PMPM: Prediction by Combining Multiple Partial Matches
PMPM:通过组合多个部分匹配进行预测
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hongliang Gao;Huiyang Zhou
  • 通讯作者:
    Huiyang Zhou
A Highly Efficient FFT Using Shared-Memory Multiplexing
使用共享内存复用的高效 FFT
Improving branch prediction accuracy via effective source information and prediction algorithms
通过有效的源信息和预测算法提高分支预测精度
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Huiyang Zhou;Hongliang Gao
  • 通讯作者:
    Hongliang Gao
Cerebellar pilocytic astrocytomas with spontaneous intratumoral hemorrhage in the elderly
老年人小脑毛细胞性星形细胞瘤伴自发性瘤内出血
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Shuo Sun;Huiyang Zhou;Zhao;Hui Shi
  • 通讯作者:
    Hui Shi
Improving software security via runtime instruction-level taint checking
通过运行时指令级污点检查提高软件安全性
  • DOI:
    10.1145/1181309.1181313
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jingfei Kong;C. Zou;Huiyang Zhou
  • 通讯作者:
    Huiyang Zhou

Huiyang Zhou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Huiyang Zhou', 18)}}的其他基金

SHF: Small: Collaborative Research: Efficient Memory Persistency for GPUs
SHF:小型:协作研究:GPU 的高效内存持久性
  • 批准号:
    1908406
  • 财政年份:
    2019
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Towards Smart and Secure Non Volatile Memory
SaTC:核心:小型:迈向智能、安全的非易失性存储器
  • 批准号:
    1717550
  • 财政年份:
    2017
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
SHF: Small: CPU-GPU Collaborative Execution in Fusion Architectures
SHF:小型:融合架构中的 CPU-GPU 协作执行
  • 批准号:
    1216569
  • 财政年份:
    2012
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
TC: Medium: Collaborative Research: Side-Channel-Proof Embedded Processors with Integrated Multi-Layer Protection
TC:中:协作研究:具有集成多层保护的侧通道防护嵌入式处理器
  • 批准号:
    0905223
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
TC: Medium: Collaborative Research: Side-Channel-Proof Embedded Processors with Integrated Multi-Layer Protection
TC:中:协作研究:具有集成多层保护的侧通道防护嵌入式处理器
  • 批准号:
    1004945
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
CAREER: Architectural Support for Automated Software Debugging
职业:自动化软件调试的架构支持
  • 批准号:
    0968667
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant
CAREER: Architectural Support for Automated Software Debugging
职业:自动化软件调试的架构支持
  • 批准号:
    0747062
  • 财政年份:
    2008
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant
Support for the 39th Annual ACM/IEEE International Symposium on Microarchitecture, 2006
支持 2006 年第 39 届 ACM/IEEE 国际微架构研讨会
  • 批准号:
    0652216
  • 财政年份:
    2007
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2334624
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
  • 批准号:
    2153749
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Architecture Innovations for Enabling Simultaneous Translation at the Edge
合作研究:SHF:小型:支持边缘同步翻译的架构创新
  • 批准号:
    2223484
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Architecture Innovations for Enabling Simultaneous Translation at the Edge
合作研究:SHF:小型:支持边缘同步翻译的架构创新
  • 批准号:
    2223483
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
  • 批准号:
    2153748
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
  • 批准号:
    2153747
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Software Hardware Architecture Co-Design for Enabling True Virtual Reality on Mobile Devices
合作研究:SHF:小型:软件硬件架构协同设计,在移动设备上实现真正的虚拟现实
  • 批准号:
    2215042
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Software Hardware Architecture Co-Design for Enabling True Virtual Reality on Mobile Devices
合作研究:SHF:小型:软件硬件架构协同设计,在移动设备上实现真正的虚拟现实
  • 批准号:
    2215043
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2126643
  • 财政年份:
    2021
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2126642
  • 财政年份:
    2021
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了