Reduced-precision formats for high-performance and energy-efficient computations
用于高性能和节能计算的降低精度格式
基本信息
- 批准号:16K16062
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2016
- 资助国家:日本
- 起止时间:2016-04-01 至 2019-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
OzBLAS: Accurate and Reproducible BLAS Based on Ozaki Scheme
OzBLAS:基于 Ozaki 方案的准确且可重复的 BLAS
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Daichi Mukunoki;Takeshi Ogita;Katsuhisa Ozaki
- 通讯作者:Katsuhisa Ozaki
Reduced-Precision Floating-Point Formats on GPUs for High Performance and Energy Efficient Computation
GPU 上的低精度浮点格式可实现高性能和高能效计算
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:C.Zhang;B.Gu;Z.Liu;K.Yamori;and Y.Tanaka;Daichi Mukunoki and Toshiyuki Imamura
- 通讯作者:Daichi Mukunoki and Toshiyuki Imamura
Level-3 BLASに基づく高精度行列積計算法による高精度かつ再現性のあるBLASルーチンの実装とその最適化
使用基于Level-3 BLAS的高精度矩阵乘法计算方法实现和优化高精度和可重复的BLAS例程
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:椋木大地;荻田武史;尾崎克久
- 通讯作者:尾崎克久
Reduced-/Extended-precision BLASの実装方法の検討
考虑如何实现降低精度/扩展精度 BLAS
- DOI:
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:椋木大地;今村俊幸
- 通讯作者:今村俊幸
Implementation Techniques for High Performance BLAS Kernels on Modern GPUs
现代 GPU 上高性能 BLAS 内核的实现技术
- DOI:
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:Daichi Mukunoki;Toshiyuki Imamura and Daisuke Takahashi
- 通讯作者:Toshiyuki Imamura and Daisuke Takahashi
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mukunoki Daichi其他文献
Infinite-Precision Inner Product and Sparse Matrix-Vector Multiplication Using Ozaki Scheme with Dot2 on Manycore Processors
在众核处理器上使用 Ozaki 方案和 Dot2 进行无限精度内积和稀疏矩阵向量乘法
- DOI:
10.1007/978-3-031-30442-2_4 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Mukunoki Daichi;Ozaki Katsuhisa;Ogita Takeshi;Imamura Toshiyuki - 通讯作者:
Imamura Toshiyuki
プライバシ保護深層学習のための SGX分散処理の提案.
针对隐私保护深度学习的 SGX 分布式处理提案。
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Mukunoki Daichi;Ozaki Katsuhisa;Ogita Takeshi;Iakymchuk Roman;加納英樹,加藤郁之,ティブシメディ,阿部正幸,曹洋 - 通讯作者:
加納英樹,加藤郁之,ティブシメディ,阿部正幸,曹洋
Can We Avoid Rounding-Error Estimation in HPC Codes and Still Get Trustworthy Results?
我们能否避免 HPC 代码中的舍入误差估计并仍然获得值得信赖的结果?
- DOI:
10.1007/978-3-030-63618-0_10 - 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Jezequel Fabienne;Graillat Stef;Mukunoki Daichi;Imamura Toshiyuki;Iakymchuk Roman - 通讯作者:
Iakymchuk Roman
Accurate Matrix Multiplication on Binary128 Format Accelerated by Ozaki Scheme
Ozaki 方案加速的 Binary128 格式的精确矩阵乘法
- DOI:
10.1145/3472456.3472493 - 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Mukunoki Daichi;Ozaki Katsuhisa;Ogita Takeshi;Imamura Toshiyuki - 通讯作者:
Imamura Toshiyuki
Conjugate Gradient Solvers with High Accuracy and Bit-wise Reproducibility between CPU and GPU using Ozaki scheme
使用 Ozaki 方案在 CPU 和 GPU 之间实现高精度和按位可重复性的共轭梯度求解器
- DOI:
10.1145/3432261.3432270 - 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Mukunoki Daichi;Ozaki Katsuhisa;Ogita Takeshi;Iakymchuk Roman - 通讯作者:
Iakymchuk Roman
Mukunoki Daichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mukunoki Daichi', 18)}}的其他基金
Development of accurate and reproducible matrix computation library for massively parallel environments
为大规模并行环境开发精确且可重复的矩阵计算库
- 批准号:
19K20286 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
相似海外基金
SHF: Small: Domain-Specific FPGAs to Accelerate Unrolled DNNs with Fine-Grained Unstructured Sparsity and Mixed Precision
SHF:小型:特定领域 FPGA 加速具有细粒度非结构化稀疏性和混合精度的展开 DNN
- 批准号:
2303626 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Standard Grant
Mixed Precision Symmetric Eigensolvers: Proof of Concept
混合精度对称特征求解器:概念证明
- 批准号:
EP/W018101/1 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Research Grant
Mixed Precision Arithmetic for Large Scale Linear Inverse Problems
大规模线性反问题的混合精度算法
- 批准号:
2208294 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Standard Grant
Mixed precision techniques in numerical simulations
数值模拟中的混合精度技术
- 批准号:
2213533 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Studentship