课题基金基金详情
基于张量积的向量化代码自动生成和调优技术研究
结题报告
批准号:
61572025
项目类别:
面上项目
资助金额:
48.0 万元
负责人:
刘仲
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2019
批准年份:
2015
项目状态:
已结题
项目参与者:
扈啸、邓让钰、张雪萌、张军阳、王子聪、田希、鲁庆男、黄琳琳、黄佳帅
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。
英文摘要
Fast changing, increasingly complex, and diverse computing platforms pose central problems in scientific computing: How to achieve, with reasonable effort, portable optimal performance? In order to achieve the automatic vectorization code generation, performance optimization and platform adaption for vector processor of fused multiply-add architecture, this project intends to design specific mathematical structures and algebraic rules of digital signal transform algorithm by the tensor product, studys the general method to convert any transform algorithm into an FMA algorithm, parallelization and vectorization algorithms,as well as to automatically generate vectorization code, automatic tuning and evaluation algorithm. Design and synthesize a set of adaptive automatic tuning and high performance vectorization code generation mechanism and implementation algorithm based on tensor product, and evaluate and compare the performance of the mechanisms and algorithms by experimental tests and theoretical analysis.
计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Design and Implementation of Deep Neural Network for Edge Computing
边缘计算深度神经网络的设计与实现
DOI:10.1587/transinf.2018edp7044
发表时间:2018-08
期刊:IEICE Transactions on Information and Systems
影响因子:0.7
作者:Junyang Zhang;Yang Guo;Xiao Hu;Rongzhen Li
通讯作者:Rongzhen Li
DOI:--
发表时间:2018
期刊:计算机应用研究
影响因子:--
作者:张军阳;王慧丽;郭阳;扈啸
通讯作者:扈啸
DOI:--
发表时间:2018
期刊:国防科技大学学报
影响因子:--
作者:王子聪;陈小文;郭阳
通讯作者:郭阳
DOI:--
发表时间:2018
期刊:国防科技大学学报
影响因子:--
作者:张军阳;郭阳
通讯作者:郭阳
Cache access fairness in 3D mesh-based NUCA
基于 3D 网格的 NUCA 中的缓存访问公平性
DOI:10.1109/access.2018.2862633
发表时间:2018-08
期刊:IEEE Access
影响因子:3.9
作者:王子聪;陈小文;鲁中海;郭阳
通讯作者:郭阳
面向Peta规模计算的自适应存储管理关键技术研究
国内基金
海外基金