面向百核处理器Cache一致性协议的高效片上网络研究
结题报告
批准号:
61303065
项目类别:
青年科学基金项目
资助金额:
25.0 万元
负责人:
马胜
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2016
批准年份:
2013
项目状态:
已结题
项目参与者:
万江华、王友瑞、刘聪、王琼、杨柳、张帅、刘建平、鲍宜鹏
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
半导体技术的发展不断增加芯片集成的核数,业界已进入百核处理器时代。片上网络较好地克服了传统总线互联结构的诸多不足,它已成为百核处理器事实上片内互联标准。另一方面,并行编程的高难度和兼容遗留代码的需求使得百核处理器依然采用cache 一致性协议,但百核处理器上的cache一致性协议面临着事务延迟上升、层次化结构、消息量剧增、多播和归约通信瓶颈诸多挑战。为缓解这些挑战,需要在分析一致性协议结构和通信特征的基础上优化设计片上网络。本课题主要研究高效支持百核处理器cache一致性协议的片上网络关键技术,包括低延迟的动态可重构拓扑结构、维持区域隔离的高性能路由算法、高效传输短报文的流控机制、多播和归约通信的硬件支持等。本课题的研究可以为百核处理器片内互联架构的设计与实现奠定坚实的理论和技术基础,具有重要的理论意义和应用价值。
英文摘要
The advancement of semiconduct technology continuously increases the core count. The industry has entered the era of hundred-core processors. The traditional bus communication mechanism has several disadvantages in hundred-core processors. The Network-on-Chip (NoC) effectively overcomes these disadvantages, and becomes the de facto communication standard for hundred-core processors. On the other hand, due to the difficulty of parallel programming and compatibility requirements of history codes, cache coherence protocols will exist in hundred-core platforms. However, coherence protocols in hundred-core processors face several challenges, including the increase of transaction latency, the hierachical structure, the growth of message count, and the bottleneck of multicast and reduction communication. To address these challenges, it is necessary to optimze the design of NoC based on the structure of the protocol and the characteristics of the coherent traffic. This project mainly researches on key techniques of designing efficient NoC to support the coherence protocols in hundred-core processors. We will delve into four research directions: 1. reconfigurable topology with low latency; 2. high performance routing algorithm which dynamically isolates different regions; 3. efficient flow control for short packets; 4. hardware support for multicast and reduction communication. The study of this project establishes a solid theoretical and technical foundation for the design of the communication mechanism for hundred-core processors. It has both important engineering value and theoretical significance.
百核处理器上的cache一致性协议面临着事务延迟上升、层次化结构、消息量剧增、多播和归约通信瓶颈诸多挑战。为缓解这些挑战,需要在分析一致性协议结构和通信特征的基础上优化设计片上网络。本课题主要研究高效支持百核处理器cache一致性协议的片上网络关键技术,项目研究进展顺利,在面向一致性协议的低延迟拓扑结构、动态隔离一致性区域的路由算法、无死锁高效传输短控制报文的流控机制和消除一致性协议多播和归约通信瓶颈等方面取得了一些关键技术的突破和创新,在拓扑结构方面提出了多链路无阻塞环网拓扑结构和异构环-链拓扑结构,这两种拓扑结构都有效地降低了报文传输延迟。在路由算法方面提出了动态延迟感知的负载均衡路由算法和基于区域洪水算法的容错路由算法,并提出了一种高效的容错路由器结构。在流控机制方面提出了面向完全自适应路由算法的新颖流控机制和面向torus网络的无死锁流控机制,这两种流控机制都能高效传输短报文。在消除聚合通信瓶颈方面提出了提高服务质量的自适应剩余跳数流控机制和低开销的无冲突片上网络结构。本课题的研究可以为百核处理器片内互联架构的设计与实现奠定坚实的理论和技术基础,具有重要的理论意义和应用价值。本课题全面完成了研究计划。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2016
期刊:计算机工程与科学
影响因子:--
作者:田玉恒;马胜;鲁建壮;杨柳
通讯作者:杨柳
A SIMD Multiple-Precision Floating-Point Multiplier For Digital Signal Processors
用于数字信号处理器的SIMD多精度浮点乘法器
DOI:--
发表时间:2014
期刊:IEICE Electronics Express
影响因子:0.8
作者:Zonglin Liu;Sheng Ma;Yang Guo
通讯作者:Yang Guo
Exploiting Parallelism in the Simulation of GPGPU Program
在 GPGPU 程序仿真中利用并行性
DOI:--
发表时间:--
期刊:Journal of Shanghai Jiaotong University
影响因子:--
作者:ZHAO Xia;MA Sheng;CHEN Wei;WANG Zhi-ying
通讯作者:WANG Zhi-ying
DOI:10.1587/elex.12.20141190
发表时间:2015-01
期刊:IEICE Electron. Express
影响因子:--
作者:Chen Li;Sheng Ma;Shenggang Chen;Yang Guo;Peng Wang
通讯作者:Chen Li;Sheng Ma;Shenggang Chen;Yang Guo;Peng Wang
DOI:--
发表时间:2016
期刊:计算机学报
影响因子:--
作者:李晨;马胜;王璐;郭阳
通讯作者:郭阳
基于芯粒的训练加速器结构
面向深度学习训练的2.5D堆叠加速器结构研究
2.5D堆叠众核协处理器片上网络结构研究
国内基金
海外基金