In-Storage Accelerator Architectures for Large-Scale Sparse Matrix Processing
用于大规模稀疏矩阵处理的存储内加速器架构
基本信息
- 批准号:21K17720
- 负责人:
- 金额:$ 3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
疎行列処理に関する包括的なアーキテクチャの実現を目指して,昨年度は,疎行列関連の主な基本演算である,疎行列と疎行列の積(SpMM)を高速化するアーキテクチャ/マイクロアーキテクチャの研究を行い,ハードウェアプロトタイプとしてFPGA実装を進めてきた.具体的には,SpMMをより効率的に処理する,一昨年度に提案した新しいデータフローをベースにアーキテクチャ/マイクロアーキテクチャの詳細な設計とRTL実装を行った.SpMMの基本的な処理データフローとして,inner product, outer product, row/column-wise productが挙げられる.Inner productでは,入力行列を繰り返し何度も読み込む必要があり,インデックスがマッチしている要素同士のみの乗算を行うため,メモリアクセス量が膨大になるわりに,無効なものが多い.この問題は,入力行列の密度が低ければ低いほど深刻となる.そこで,本研究は,疎行列により相性が良いouter productとrow/column-wise productをベースにより効率的な処理データフローとその特徴に合ったアーキテクチャ/マイクロアーキテクチャを設計した.初期評価では,機能レベルのシミュレータを開発し,全体の性能や消費電力に大きく影響する外部メモリアクセス量に着目してSpArchという代表的な最先端SpMM処理アーキテクチャと比較を行った.この成果を2022年並列/分散/協調処理に関するサマー・ワークショップ (SWoPP2022)で発表した.以上の有望な結果を踏まえて,アーキテクチャ/マイクロアーキテクチャの設計とRTL実装を行い,AMD-Xilinx社のAlveoアクセラレータカードで動かして詳細な評価を進めている.
In order to improve the speed of the research on the matrix processing, including the realization of the matrix processing, the FPGA implementation has been improved in the past year. The detailed design and installation of SpMM are carried out in detail. The basic processing of SpMM is carried out in detail.Inner product, outer product, row/column-wise product. Inner product, inner product, outer product, row/column-wise product. In addition, the number of elements in the same category is increased, and the number of elements is increased. The problem is that the density of the force train is low, low, deep. This study is based on the design of row/column-wise product. The initial evaluation is that the performance of the whole unit is greatly affected by the power consumption. The external power consumption is mainly affected by the performance of the unit. This achievement will be announced in 2022 for parallel/decentralized/coordinated processing (SWoPP2022). The above results are expected to be implemented in the design and RTL implementation of AMD-Xilinx's Alveo Access Control System.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
外部メモリアクセス抑制による高効率疎行列積アクセラレータの研究
抑制外部存储器访问的高效稀疏矩阵乘积加速器研究
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:M. Ahookhosh;A. Themelis;and P. Patrinos;Andreas Themelis;Akram Ben Ahmed;廖望;永原雄大,安藤洸太,川村一志,劉載勲,本村真人,Thiem Van Chu
- 通讯作者:永原雄大,安藤洸太,川村一志,劉載勲,本村真人,Thiem Van Chu
A High-Performance and Flexible FPGA Inference Accelerator for Decision Forests Based on Prior Feature Space Partitioning
基于先验特征空间划分的决策林的高性能、灵活的 FPGA 推理加速器
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Thiem Van Chu;Ryuichi Kitajima;Kazushi Kawamura;Jaehoon Yu;Masato Motomura
- 通讯作者:Masato Motomura
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
CHU ThiemVan其他文献
CHU ThiemVan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('CHU ThiemVan', 18)}}的其他基金
自己適応型エッジAIオンライン学習基盤の創出
打造自适应边缘AI在线学习平台
- 批准号:
24K02911 - 财政年份:2024
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
精度保証のある高精度数値計算のための並列処理による高速化
通过并行处理在保证精度的情况下加速高精度数值计算
- 批准号:
22K11978 - 财政年份:2022
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Creation of Scalable Computers and their System Software for Post-Moore Era
为后摩尔时代创建可扩展计算机及其系统软件
- 批准号:
20H00593 - 财政年份:2020
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
多様化するエッジコンピューティングのための高効率コア及び形状自在SiPの研究
研究高效核心和形状灵活的SiP,实现边缘计算多样化
- 批准号:
19J13974 - 财政年份:2019
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Creation of non-Neumann FPGA Overlay Architecture for Innovating HPC
创建非诺依曼 FPGA 叠加架构以创新 HPC
- 批准号:
17H01706 - 财政年份:2017
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Study on Data Flow-oriented Access Control Structure for HPC/HPDA Infrastructure
面向HPC/HPDA基础设施数据流的访问控制结构研究
- 批准号:
17KT0083 - 财政年份:2017
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Efficient Inspection Using Behavioral Properties of Software Components
使用软件组件的行为属性进行高效检查
- 批准号:
23680001 - 财政年份:2011
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Young Scientists (A)
A supporting system for predicting vulnerabilities and their countermeasures of an information system during requirements analysis
需求分析过程中预测信息系统漏洞及其对策的支撑系统
- 批准号:
23500042 - 财政年份:2011
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Extracting The Regions with No Memory Accessfor High-level Synthesis
提取没有内存访问的区域以进行高级综合
- 批准号:
22500034 - 财政年份:2010
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Generation and verification of COINS compiler optimizers using temporal logic and high-level extensions of optimizers
使用时序逻辑和优化器的高级扩展生成和验证 COINS 编译器优化器
- 批准号:
22300007 - 财政年份:2010
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Automatic Fault Detection based on Data-Flow Analysis for Software Components
基于软件组件数据流分析的自动故障检测
- 批准号:
21700030 - 财政年份:2009
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Young Scientists (B)