面向流计算的高能效NoC体系结构研究

批准号:
61802312
项目类别:
青年科学基金项目
资助金额:
27.0 万元
负责人:
王继禾
依托单位:
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2021
批准年份:
2018
项目状态:
已结题
项目参与者:
王党辉、赵伟勋、李楚曦、刘咪咪、姜蒙飞、黄澍
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
随着大数据、边沿计算、深度学习等技术的兴起,数据流动性已成为影响软件算力的关键因素。但现有的片上存储技术和体系结构难以支撑序列化流数据的高速访问,造成"数据流迟滞"和"加速器饥饿"问题并存。为解决此问题,本项目采用新型流存储材料构建专门面向流计算的NoC体系结构,从流数据传输、分布式存储、高性能馈入三个层面强化数据流动性。1)通过引入新型赛道存储器,研究能适应流数据访问特征的NoC路由缓存结构,实现高能效的流数据传输;2)设计面向分布式数据源的一致性存储协议,实施"去中心化"流管理,加速算法演化过程中的数据源查询和切入响应;3)研究由指令驱动的"全局任务图划分策略"和"细粒度涡流调度结构",为流加速器提供软/硬件结合的高性能数据馈入机制。本项目通过以上问题的研究,构建"材料、结构、算法三者相统一"的高性能片上存储架构,最终实现软件定义的流计算体系结构设计。
英文摘要
Many newly emerging computing techniques, such as big data, edge computing, and deep learning, rely on a high data-liquidity to achieve powerful stream computation. However, current on-chip memory architectures cannot support an efficient way of sequential accessing on streaming-data, causing both sluggish transmission and hungry accelerators. To overcome the issue, this project uses Racetrack Memory (RM), a new kind of on-chip stream memory technique, to build a specific Network-on-chip architecture for stream acceleration. The contributions include fast stream transportation, distributed stream storage, and high performance stream feeding to cores. Firstly, a kind of RM-friendly buffer is designed to remove extra shift operations so that little energy/latency is consumed in access alignments and stream-flow efficiency benefits from a continuously transmit. Secondly, a protocol-based source management is proposed for a coherence data searching with a decentralized stream strategy, which enjoys a fast source locating and steam cutting-over in NoC. Thirdly, an ISA-driven architecture design provides a global mapping for coarse-grained task schedule and a local eddy structure for fine-grained flow routing, which, essentially, follows a SW/HW co-designed pattern to a feeding stream accelerators. With a collaborative design of materials, structure, and algorithm, this project aims to propose and implement a complete software-defined stream architecture to strengthen the data liquidity of distributed stream algorithms.
随着大数据、边沿计算、深度学习等技术的兴起,数据流动性已成为影响软件算力的关键 因素。但现有的片上存储技术和体系结构难以支撑序列化流数据的高速访问,造成"数据流迟 滞"和"加速器饥饿"问题并存。为解决此问题,本项目采用新型流存储材料构建专门面向流计 算的NoC体系结构,从流数据传输、分布式存储、高性能馈入三个层面强化数据流动性。1)通 过引入新型赛道存储器,研究一种基于连续堆栈操作的序列化NoC缓存结构,实现高能效流数 据传输;2)设计面向分布式数据源的一致性存储协议,实施"去中心化"流管理,加速算法演 化过程中的数据源查询和切入响应;3)研究由指令驱动的"全局任务图划分策略"和"细粒度涡 流调度结构",为流加速器提供软/硬件结合的高性能数据馈入机制。本项目通过以上问题的研 究,构建"材料、结构、算法三者相统一"的高性能片上存储架构,最终实现软件定义的流计算 体系结构设计。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
A low-power sensor polling for aggregated-task context on mobile devices
移动设备上聚合任务上下文的低功耗传感器轮询
DOI:10.1016/j.future.2019.02.027
发表时间:2019-09
期刊:Future Generation Computer Systems
影响因子:--
作者:Jihe Wang;Danghui Wang;Bing Guo
通讯作者:Bing Guo
An Automatic-Addressing Architecture with Fully Serialized Access in Racetrack Memory for Energy-Efficient CNNs
用于节能 CNN 的赛道存储器中具有完全序列化访问的自动寻址架构
DOI:10.1109/tc.2020.3045433
发表时间:2022
期刊:IEEE Transactions on Computers, pre-print, 2021. DOI:10.1109/TC.2020.3045433
影响因子:--
作者:Jihe Wang;Jun Liu;Danghui Wang;Jianfeng An;Xiaoya Fan
通讯作者:Xiaoya Fan
DOI:doi: 10.1109/TC.2022.3148858
发表时间:--
期刊:IEEE Transactions on Computers
影响因子:--
作者:Jihe Wang;Jun Liu;Danghui Wang;Shengbing Zhang;Xiaoya Fan
通讯作者:Xiaoya Fan
Tiler: An Autonomous Region-Based Scheme for SMR Storage
Tiler:基于自治区域的 SMR 存储方案
DOI:--
发表时间:2021
期刊:IEEE Transactions on Computers
影响因子:3.7
作者:Chenlin Ma;Zhaoyan Shen;Jihe Wang;Yi Wang;Renhai Chen;Yong Guan;Zili Shao
通讯作者:Zili Shao
MemUnison: A Racetrack-ReRAM-combined Pipeline Architecture for Energy-Efficient in-Memory CNNs
MemUnison:一种用于节能内存 CNN 的 Racetrack-ReRAM 组合管道架构
DOI:10.1109/tc.2022.3148858
发表时间:--
期刊:IEEE Transactions on Computers
影响因子:3.7
作者:Jihe Wang;Jun Liu;Danghui Wang;Shengbing Zhang;Xiaoya Fan
通讯作者:Xiaoya Fan
面向边缘智能的随机近存计算专用体系结构研究
- 批准号:--
- 项目类别:面上项目
- 资助金额:53万元
- 批准年份:2022
- 负责人:王继禾
- 依托单位:
国内基金
海外基金
