Application of Unconventional Linear Algebra Techniques to Continuous Learning in Supergiant Neural Networks
非常规线性代数技术在超巨神经网络连续学习中的应用
基本信息
- 批准号:20K20624
- 负责人:
- 金额:$ 16.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Challenging Research (Pioneering)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-07-30 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
深層学習へ2次最適化を適用する際に課題となる大規模な密行列の分解を高速かつ並列に行うための新たな手法を複数開発した。大きさがNxNの密行列のLU分解はO(N^3)の計算量を要するが、HSS行列やH行列などの階層的低ランク近似法を用いることでその計算量をO(NlogN)もしくはO(N)に低減できる。しかし、HSS行列では弱許容条件を用いるため高次元の問題では非対角ブロックのランクがNとともに増大しO(N)の手法ではなくなるものおn、ULV分解の原理を応用することでブロック同士の依存性をなくし超並列で計算できる。また、H行列は強許容条件を用いるためランクの増大はないものの、非対角の密ブロックから生じるfill inによりULV分解の原理を用いたとしても超並列な行列分解ができない。本研究ではHSS-ULV分解の並列度とH行列のO(N)の計算量の両方を併せ持つH^2-ULV分解開発した。H^2行列はHSS行列と同様、行や列ブロックの基底を共有する。ただし、基底を共有しただけでは密ブロックから生じるfill inを防げないため、超並列なLU分解はそのままではできない。そこで、予めfill inを計算しておき、それらを行や列ブロックの基底に含めることで、ULV分解の際に生じるfill inを共有基底を更新することなく再圧縮でき、強許容条件を有しながらも超並列なLU分解を世界で初めて実現した。この成果は高性能計算分野のトップカンファレンスであるSC22に採択された。さらに、この研究から派生した研究として超並列性を利用したGPU実装への拡張(IJHPCAに投稿中)、テネシー大学のDongarra研究室との共同研究でPaRSECランタイムを用いた階層間の依存性の緩和(ICPPに投稿中)やLDL分解への拡張による電子状態計算における固有値解法への応用(ICPPに投稿中)などが挙げられる。
Deep learning is a two-time optimization method that is applicable to international projects and is a large-scale decomposition of dense rows and high-speed parallel rows and a new and complex method. Large NxN dense row and column decomposition of LU, O(N^3) calculation amount, HSS row and row, H row and row, and HSS row and row. The hierarchical low-level approximation method uses a low-reduction calculation method of O(NlogN) and O(N).しかし、HSS queue is weakly allowed condition を Use いるためHigh-dimensional problem では Non-対angle ブロックのランクがNとともに嗗大しO(N) The technique is the same as the principle of ULV decomposition, and the principle of ULV decomposition is the same as the dependency of the same person, and the super-parallel calculation is the same.また、H row はstrong permission condition を用いるためランクのincreasing large はないものの、non-対角の米ブロックから生じるfill The principle of inによりULV decomposition is the use of super parallel row and column decomposition. In this study, the degree of parallelism of HSS-ULV decomposition and the calculation amount of O(N) in HSS-ULV decomposition and the parallelism of H^2-ULV decomposition are determined. H^2 rows and columns, HSS rows and columns, and rows and columns share the same base.ただし、basisをshared しただけでは density ブロックから生じるfill inをanti-げないため, super-parallel なLU decomposition はそのままではできない.そこで、为めfill inをcalculationしておき、それらを行や行ブロックのbaseに contain めることで、ULV decomposition の国际に生じるfill inをshares the base and updates the world and compresses it again, and the strong tolerance condition is the super parallel and LU decomposition of the world. The result of this project is the high-performance computing division of the high-performance computing field, SC22. IJ PaRSE is jointly researched by HPCA (submission under submission) and Dongarra Laboratory of Tuscany University. Cランタイムを is used to alleviate the dependence between classes (ICPP is being submitted) and is used to decompose LDLによるElectron state calculationにおけるIntrinsic value solutionへの応用(ICPPにsubmission in progress)などが挙げられる.
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Recovering single precision accuracy from Tensor Cores while surpassing the FP32 theoretical peak performance
- DOI:10.1177/10943420221090256
- 发表时间:2022-03
- 期刊:
- 影响因子:0
- 作者:Hiroyuki Ootomo;Rio Yokota
- 通讯作者:Hiroyuki Ootomo;Rio Yokota
Iterative Refinement with Hierarchical Low-rank Preconditioners Using Mixed Precision
使用混合精度的分层低阶预处理器进行迭代细化
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Hoang Dinh;L.;Aoyama;E.;Hiasa;M;Omote;H.;Kubota;S.;Kuboki;T.;Takigawa;M.;Thomas Spendlhofer
- 通讯作者:Thomas Spendlhofer
深層学習における2次最適化の汎化性能の検証
深度学习二次优化泛化性能验证
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:宮本忠吉;伊藤剛;フィーリー真利奈;嶋田愛;中原英博; 澤井亨;仲田秀臣;大槻伸吾.;石井央,横田理央
- 通讯作者:石井央,横田理央
Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors
Intel、AMD 和 Fujitsu 处理器上的批量、小型和矩形矩阵乘法的缓存优化和性能建模
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:2.7
- 作者:Sameer Deshmukh;Rio Yokota;George Bosilca
- 通讯作者:George Bosilca
O(N) Factorization of Dense Matrices on GPUs Without Trailing Submatrix Dependencies
在 GPU 上进行密集矩阵的 O(N) 分解,无需尾随子矩阵依赖
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Qianxiang Ma;Rio Yokota
- 通讯作者:Rio Yokota
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
横田 理央其他文献
Petascale Turbulence Simulation Using FMM
使用 FMM 进行千万亿级湍流模拟
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
成見 哲;T. Narumi;横田 理央;Rio Yokota;L. Barba;泰岡 顕治;K. Yasuoka - 通讯作者:
K. Yasuoka
横田 理央的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('横田 理央', 18)}}的其他基金
階層的低ランク近似による高速・高精度な固有値計算と大規模電子状態計算への応用
分层低阶近似的高速高精度特征值计算及其在大规模电子结构计算中的应用
- 批准号:
23K24854 - 财政年份:2024
- 资助金额:
$ 16.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Fast and accurate eigenvalue calculations by hierarchical low-rank approximation and its application to large-scale electronic structure calculations
分层低阶近似快速准确的特征值计算及其在大规模电子结构计算中的应用
- 批准号:
22H03598 - 财政年份:2022
- 资助金额:
$ 16.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
エクサスケーラブルな大規模連立一次方程式の前処理としてのFMMの代数学的拡張
FMM 的代数扩展作为大规模线性方程组的可扩展预处理器
- 批准号:
15H06196 - 财政年份:2015
- 资助金额:
$ 16.22万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
相似海外基金
階層的低ランク近似による高速・高精度な固有値計算と大規模電子状態計算への応用
分层低阶近似的高速高精度特征值计算及其在大规模电子结构计算中的应用
- 批准号:
23K24854 - 财政年份:2024
- 资助金额:
$ 16.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)














{{item.name}}会员




