基于DNN开发框架的高性能优化方法研究

批准号:
61972293
项目类别:
面上项目
资助金额:
60.0 万元
负责人:
何炎祥
依托单位:
学科分类:
软件理论、软件工程与服务
结题年份:
2023
批准年份:
2019
项目状态:
已结题
项目参与者:
何炎祥
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
深度神经网络(Deep neural network,DNN)是当前许多人工智能应用的基础。现有的DNN开发框架设计的重点是改善开发环境的可用性,在高级编程语言和后端计算设备的支持上做了很多工作,但是在优化方面的工作远远不够。本项目拟在现有DNN开发框架的基础上,探索在各个层次上实现更高效的性能优化,提出一个更高性能的DNN开发框架。拟提出的DNN开发框架包括以下三个层次:在模型层,提出一套自动数据量化机制,简化网络模型;同时提出基于节点间关系的模型切割与分配的方法,为中间层上计算子图的处理提供更好的布局。在中间层,基于将计算描述和调度优化分离的思想,结合软件流水优化、多面体模型优化等优化方法,为硬件层上不同的终端生成高效的代码。在硬件层,提出一套稀疏矩阵计算优化方案,提升矩阵计算的性能;同时,提出一套面向DNN的GPU内存优化机制,指导数据预取,提升底层运算的性能。
英文摘要
Deep neural network (DNN) is the basis of many current artificial intelligence applications. The existing DNN development framework focuses on improving the usability of the development environment, doing a lot of work on the support of high-level programming languages and back-end computing devices, but the work on optimization is not enough. Based on the existing DNN development framework, this project aims to achieve more efficient performance optimization at various levels and propose a higher performance DNN development framework. The proposed DNN development framework includes the following three levels: At the model level, an automatic data quantification mechanism is proposed to simplify the network model; a model cutting and allocation method based on the relationship between nodes is proposed, which provides a better layout for the processing of computational subgraphs on the intermediate layer. At the intermediate layer, based on the idea of separating the computational description and the scheduling optimization, combined with the optimization methods such as software pipeline optimization and polyhedral model optimization, efficient code is generated for different terminals on the hardware layer. At the hardware layer, a set of sparse matrix computing optimization scheme is proposed to improve the performance of matrix computing; a set of GPU memory optimization mechanism for DNN is proposed to guide data prefetching and improve the performance of hardware.
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1007/s11265-022-01765-4
发表时间:2022-06
期刊:Journal of Signal Processing Systems
影响因子:--
作者:F. Liu;Yanxiang He;Jing He;Xing Gao;Feihu Huang
通讯作者:F. Liu;Yanxiang He;Jing He;Xing Gao;Feihu Huang
DOI:--
发表时间:2022
期刊:IEEE Transactions on Information Forensics and Security
影响因子:6.8
作者:Fajun Sun;Selena He;Xiaotong Zhang;Jun Zhang;Qingan Li;Yanxiang He
通讯作者:Yanxiang He
DOI:https://doi.org/10.1016/j.csi.2023.103824
发表时间:2023
期刊:Computer Standards & Interfaces
影响因子:--
作者:Fanfan Shen;Lin Shi;Jun Zhang;Chao Xu;Yong Chen;Yanxiang He
通讯作者:Yanxiang He
面向嵌入式系统绿色需求的编译理论与方法研究
- 批准号:61373039
- 项目类别:面上项目
- 资助金额:78.0万元
- 批准年份:2013
- 负责人:何炎祥
- 依托单位:
基于编译的嵌入式系统优化研究
- 批准号:61170022
- 项目类别:面上项目
- 资助金额:58.0万元
- 批准年份:2011
- 负责人:何炎祥
- 依托单位:
可信软件构造理论与方法研究
- 批准号:91118003
- 项目类别:重大研究计划
- 资助金额:300.0万元
- 批准年份:2011
- 负责人:何炎祥
- 依托单位:
可信编译理论与实现方法研究
- 批准号:90818018
- 项目类别:重大研究计划
- 资助金额:50.0万元
- 批准年份:2008
- 负责人:何炎祥
- 依托单位:
面向低速率拒绝服务攻击防范的安全适应性机制研究
- 批准号:60773008
- 项目类别:面上项目
- 资助金额:25.0万元
- 批准年份:2007
- 负责人:何炎祥
- 依托单位:
低速率的拒绝服务攻击模型和防范研究
- 批准号:60642006
- 项目类别:专项基金项目
- 资助金额:7.0万元
- 批准年份:2006
- 负责人:何炎祥
- 依托单位:
国内基金
海外基金
