面向GPGPU微体系结构模拟的采样加速策略研究
结题报告
批准号:
61802062
项目类别:
青年科学基金项目
资助金额:
25.0 万元
负责人:
姜春涛
依托单位:
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2021
批准年份:
2018
项目状态:
已结题
项目参与者:
许红龙、吕春婉、刘锦梅、丁彬、程俊锋、欧阳雪泳、江欣恩
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
GPGPU微体系结构模拟是其硬件架构设计与软件应用开发的重要评估测试技术。然而,由于GPGPU软硬件的庞大与复杂性,其微体系结构模拟速度缓慢,评估测试周期漫长,严重制约设计开发效率。本项目针对这一问题,主要研究面向GPGPU微体系结构模拟的采样加速理论与策略。主要研究内容分为循序渐进的三部分:首先,研究刻画GPGPU程序运行行为特征表示方法,提出分析行为特征理论模型,为采样模型建立与策略设计提供理论指导;其次,基于GPGPU行为特征的分析归纳,开展契合GPGPU环境的分层采样模拟加速理论研究与策略设计;再次,构建采样模拟效率评估模型,研究影响模拟精度与速度的重要因素,并根据评估结果与影响因素反馈优化采样模拟加速理论模型与策略。最终,本项目提供一种面向GPGPU微体系结构模拟的采样加速理论与方法,在保持模拟精度前提下,大幅缩短模拟评估周期(模拟时长平均减少10倍以上),显著提高模拟评估效率。
英文摘要
Micro-architectural simulation is the key technology to evaluate GPGPU’s hardware design and software development. However, the simulation speed is extremely slow due to its hardware and software complexities, which reduce the efficiency of design and development tremendously. To address this issue, this project conducts the research to accelerate GPGPU’s micro-architectural simulation and improve its evaluation efficiency through sampling theory. Firstly, by observing the inherent runtime characteristics of GPGPU benchmarks, we propose a model with reliable metrics to measure the runtime behavior. Secondly, we give a hybrid sampling methodology to speedup GPGPU’s micro-architectural simulation based on the detailed analysis of GPGPU benchmarks runtime behavior. Then, we discuss the important factors that influence simulation speed and accuracy. Moreover, we perform detailed evaluation for the proposed sampling methodology, and make further improvements guided by the analysis of experimental results. At last, this project will provide a sampling theory and strategy for GPGPU micro-architectural simulation, reduce the simulation time by a factor of 10x on average, and significantly improve GPGPU’s design and development efficiency.
随着数字化、智能化的日益普及,尤其是机器学习以及图像处理等技术广泛应用,GPGPU发挥着越来越大的作用。然后GPGPU的硬件架构设计与软件应用开发的评估测试技术发展相对滞后,受限于GPGPU软硬件的庞大与复杂性,评估测试技术中的微体系结构模拟速度缓慢,评估测试周期漫长,严重制约设计开发效率。本项目基于这一问题,开展了面向GPGPU微体系结构采样模拟的加速策略研究,研究内容分为三部分:首先,充分调研研究了日前开源GPGPU模拟器,并提出了刻画GPGPU程序运行行为特征表示方法,建立了分析行为特征的理论模型,通过特征向量的提取和聚类分析,以及分形行为的发现与应用,为采样模型建立与策略设计提供了理论指导;其次,基于GPGPU行为特征的分析归纳,设计了基于分层的采样策略模型,分三层采样选取具有代表性特征的样本片断;再次,研究了影响模拟精度与速度的重要因素,并构建了功能预热模型,设计了内存访问回放算法,为采样模拟的准确性和模拟速度提供了较好的保障。最终,本项目较完整地研究了面向GPGPU微体系结构模拟的采样加速中的各个关键问题,提出了解决方案和方法,并在开源模拟器上实现了部分功能,为后续GPGPU硬件架构设计和软件开发提供了宝贵的经验。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:org/10.1007/s00521-020-05148-3
发表时间:2020
期刊:Neural Computing and Applications
影响因子:--
作者:Wenyong Wang;Yongcheng Cui;Guangshun Li;Chuntao Jiang;Song Deng
通讯作者:Song Deng
A self-attention-based destruction and construction learning fine-grained image classification method for retail product recognition
一种基于自注意力破坏和构建学习的零售产品识别细粒度图像分类方法
DOI:10.1007/s00521-020-05148-3
发表时间:2020-07
期刊:Neural Computing and Applications
影响因子:6
作者:Wenyong Wang;Yongcheng Cui;Guangshun Li;Chuntao Jiang;Song Deng
通讯作者:Song Deng
DOI:10.1007/s11554-020-01013-7
发表时间:2020-10
期刊:Journal of Real-Time Image Processing
影响因子:3
作者:Zhixiang Yang;Kunkun He;F. Zou;Wanhua Cao;Xiaoyun Jia;Kai Li;Chuntao Jiang
通讯作者:Zhixiang Yang;Kunkun He;F. Zou;Wanhua Cao;Xiaoyun Jia;Kai Li;Chuntao Jiang
Effective multiple cancer disease diagnosis frameworks for improved healthcare using machine learning
使用机器学习改善医疗保健的有效多种癌症疾病诊断框架
DOI:10.1016/j.measurement.2021.109145
发表时间:2021-02-16
期刊:MEASUREMENT
影响因子:5.6
作者:Hsu, Ching-Hsien;Chen, Xing;Chung, Yeh-Ching
通讯作者:Chung, Yeh-Ching
国内基金
海外基金