深層学習の精度を考慮した自動性能最適化フレームワークの構築
考虑深度学习精度的自动性能优化框架构建
基本信息
- 批准号:18J22858
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-25 至 2021-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
前年度の米国LLNLの研究グループとの共同研究を1)複数モデルを用いた性能評価,2)先行研究との性能比較,3)性能モデルを用いた最適な並列化戦略の予測について発展させた. 1)については前年度に使用したCosmoFlowネットワークの他にセグメンテーションに用いられる3D U-Netを用いて性能評価を行い,どちらのモデルについてもLassenスパコンのほぼ全系である2048 GPU程度までスケールできることを明らかにした.2)については提案手法と同様のハイブリッド並列実装の性能を比較し,提案手法のフレームワークレベルでの並列化が通信時間の隠蔽に大きく寄与していることを示した.3)については富岳スパコンのような超大規模並列環境を想定し,前年度までに行った一次元分割手法の性能モデリングを発展させて多次元方向に分割した場合の性能予測を行った結果,ハイブリッド並列学習ではプロセッサあたりのバッチサイズが小さいためにシンプルな一次元分割でも非常に効果的に並列化できることが判明した.これらの結果により大規模並列環境における深層学習アプリのスケーラビリティの維持について展望を示した.この研究成果はIEEE TPDSジャーナルに投稿し採択された.また,前年度までの研究成果をまとめて博士論文として執筆した.論文では畳み込みニューラルネットワークのGPU内・GPU間の並列性を性能モデリングにより最適化し,与えられたモデルに対して最適な並列化手法・計算アルゴリズムを提供する手法を提案した.これにより,まったく未知のモデルに対してもユーザが手動でチューニングを行うことなく最適な計算手法を予測することを可能とした.また,推論精度に関しては,各計算カーネルのチューニングや同並列数あたりのミニバッチサイズを大幅に下げるハイブリッド並列化を採用することでリスクなく学習の高速化を行う手法を提案した.
The previous year's LLNL research group included joint research: 1) performance evaluation of multiple applications; 2) performance comparison of pilot studies; 3) performance evaluation of optimal applications; and prediction and development of parallel strategies. 1) To evaluate the performance of 3D U-Net used in the previous year when using CosmoFlow Internet and other services, we will use the 2048 GPU level in the entire Lassen Spark system to make it possible for all mobile devices to use the same 2048 GPU level. 2) To compare the performance of parallel installations with the same proposal method, 3) The performance prediction results of the performance prediction for the case of multi-dimensional segmentation in the previous year were obtained by considering the ultra-large-scale parallel environment in which the communication time was covered. The first step is to divide the data into two parts. As a result of this, large-scale parallel environment is a deep learning environment. The research results were submitted to IEEE TPDS. The research results of the previous year were written. This paper proposes a method to optimize the parallelism between GPUs and GPUs, and to optimize the parallelism between GPUs and GPUs. The best way to calculate is to predict. The accuracy of inference is related to the number of parallels in each calculation category.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Case for Strong Scaling in Deep Learning: Training Large 3D CNNs With Hybrid Parallelism
- DOI:10.1109/tpds.2020.3047974
- 发表时间:2020-07
- 期刊:
- 影响因子:5.3
- 作者:Yosuke Oyama;N. Maruyama;Nikoli Dryden;Erin McCarthy;P. Harrington;J. Balewski;S. Matsuoka;Peter Nug
- 通讯作者:Yosuke Oyama;N. Maruyama;Nikoli Dryden;Erin McCarthy;P. Harrington;J. Balewski;S. Matsuoka;Peter Nug
μ-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batching
- DOI:
- 发表时间:2018-04
- 期刊:
- 影响因子:0
- 作者:Yosuke Oyama;Tal Ben-Nun;T. Hoefler;S. Matsuoka
- 通讯作者:Yosuke Oyama;Tal Ben-Nun;T. Hoefler;S. Matsuoka
Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization
使用混合并行化训练大型 3D 宇宙学 CNN
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Yosuke Oyama;Naoya Maruyama;Nikoli Dryden;Peter Harrington;Jan Balewski;Satoshi Matsuoka;Marc Snir;Peter Nugent;Brian Van Essen
- 通讯作者:Brian Van Essen
深層学習におけるBatchNormalization使用時の計算時間と精度の関係性
深度学习中使用 BatchNormalization 时计算时间与精度的关系
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:八島慶汰;大山洋介;松岡聡
- 通讯作者:松岡聡
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
大山 洋介其他文献
大山 洋介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
车载中央计算平台软件框架及泊车功能研发与产业化应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
低空飞行器及其空域的设计与监管平台软件
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于金刚石高效散热封装的高功率高压GaN器件研发与产业化
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
新能源智能汽车高性能精密零部件装备研制与产业化
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
高效智能化超低风速风电机组关键技术及装备研制
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
绿氢制储加注关键技术与装备研发
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
复杂电子产品超精密加工及检测关键技术研究与应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
抗消化性溃疡新药研发
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于合成生物学的动物底盘品种优化及中试应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
1.1 类中药创新药“鱼酱排毒合剂”开发
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
ハイパースペクトラルイメージングと深層学習を用いた皮膚病変鑑別システムの開発
利用高光谱成像和深度学习开发皮肤病变判别系统
- 批准号:
24K15777 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習を用いた超音波画像からのSPIDDM診断支援システムの開発
使用深度学习从超声图像开发 SPIDDM 诊断支持系统
- 批准号:
24K15775 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習を用いた拡散テンソル画像による腰椎疾患における疼痛の自動診断システム
基于深度学习的弥散张量图像腰椎疾病疼痛自动诊断系统
- 批准号:
24K15787 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
幾何学的深層学習による非線形力学系のグレーボックスモデル化技術の創出
使用几何深度学习创建非线性动力系统灰盒建模技术
- 批准号:
24K15105 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アナログ回路に基づく進化計算手法による深層学習モデルの最適化
基于模拟电路的进化计算方法优化深度学习模型
- 批准号:
24K15115 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ダイナミクス情報を考慮した深層学習技術による天然変性タンパク質複合体構造予測
使用深度学习技术考虑动力学信息预测自然变性蛋白质复合物的结构
- 批准号:
24K15183 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
地域連携プログラミング初等教育における深層学習やVRを用いた対話的学習支援システム
区域协作编程 在基础教育中使用深度学习和 VR 的交互式学习支持系统
- 批准号:
24K15230 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習とドローンを用いた温室トマトの株毎の生育データモニタリングシステム
使用深度学习和无人机的每个温室番茄植株的生长数据监测系统
- 批准号:
24K15072 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
要求と実装のトレーサビリティー追求による深層学習システムの高品質化
通过追求需求和实施的可追溯性来提高深度学习系统的质量
- 批准号:
23K21657 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
近接・衛星センシングと深層学習を駆使した土壌特性マップ群の創出
使用邻近/卫星传感和深度学习创建土壤属性图
- 批准号:
23K23665 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)