大規模並列アプリケーションの性能解析・最適化ツールの研究

大规模并行应用性能分析与优化工具研究

基本信息

项目摘要

本研究の目的は大規模な並列システムでの性能解析並びに最適化技術である。本研究では、自動的な性能最適化技術や並列実行時システムの研究を行う。その結果を京コンピュータや最新のメニーコアシステムに適用し、その有効性について検証するものである。これまで、自動的な最適化技術として、京コンピュータに用いられているプロセッサのキャッシュ最適化を行った。前年度においては、京コンピュータのような大規模なシステム、およびノード内のワークステーリングによる動的タスクスケジューリングの研究を研究の取りかかりとして、動的タスクスケジューリングを評価するためのベンチマークを開発した。Unbalanced Tree Searchベンチマークを用いて、京コンピュータにおいて1万ノードの規模におけるワークステーリングの性能について解析した。特に、システムにおけるワークの拡散の速度を解析するための性能指標を考案し、京コンピュータのネットワークトポロジーを活用した新しいワークステーリングの指針を明らかにした。この結果については当該年度において並列処理技術分野では著名な国際会議IPDPSにて発表した。当該年度においては、開発したベンチマークを用いて、大規模な並列システム上で既存の実行時システムの代表である、OpenMP 4.0, StarPU, Quak、XKappiを評価した。この結果については、現在、論文をまとめており、論文誌に投稿の準備を進めている。さらに、この知見に基づき負荷分散のシステムを設計・開発し、京コンピュータで評価した。また、並列言語であるCharm++の実行時システムとして組み合わせて、小規模な実験を行った。また、負荷分散の実行時システムの検討においては、理研計算科学研究機構で開発を進めている並列プログラミング言語XcalableMPなどPGAS(Partitioned Global Address Space)モデル上での負荷分散の機構についても議論を行った。
The purpose of this study is to analyze and optimize the performance of large-scale parallel systems. In this paper, we study the automatic performance optimization technology and its application. The results show that the latest information is available and effective. This is an automatic optimization technique. In the past year, the Chinese government has launched large-scale research on the development of mobile communication systems and mobile communication systems. Unbalanced Tree Search Search for 10,000 items in the size and performance analysis The performance index of the system is analyzed, and the new system is used to analyze the speed of the system. The results were presented at the International Conference IPDPS, which was held during the year. When the year is over, the development of the system is in use, and the large-scale parallel system is in operation, the system representatives are evaluated, OpenMP 4.0, StarPU, Quak, XKappi. The result of this paper is now, the paper is ready for submission. In this paper, the basic knowledge of load distribution system design, development, and evaluation Charm++ is the most common language in the world, and it is the most common language in the world. The research on load dispersion mechanism is carried out in the research institute of science and technology, and the research institute of science and technology is developed in parallel.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Discovering Cache Partitioning Optimizations for the K Computer
发现 K Computer 的缓存分区优化
Toward Automated Cache Partitioning on the K Computer
在 K Computer 上实现自动缓存分区
Weighted Distribution for Random Victim Selection in Distributed Work Stealing
分布式工作窃取中随机受害者选择的加权分布
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Arnaud C;鈴村崇文;Adams MJ;Weiss A;井上-村山美穂;S. Perarnau and M. Sato
  • 通讯作者:
    S. Perarnau and M. Sato
Topology-aware Optimizations for Distributed Load Balancing on the K Computer : an Introduction
K Computer 上分布式负载平衡的拓扑感知优化:简介
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Swann Perarnau;Mitsuhisa Sato;Swann Perarnau
  • 通讯作者:
    Swann Perarnau
XcalableMP presentation and tutorial
XcalableMP 演示和教程
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    戸田克樹、藤田志歩;Alexander Weiss;川村誠輝;玉井勘次;小村圭;野元武;福守朗;山本裕己;松永雅之;伊藤二三夫;伊藤英之;橋川央;井上英治;村山美穂;Swann Perarnau
  • 通讯作者:
    Swann Perarnau
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 三久其他文献

ストリーム計算による最適化を併用するFPGA向けOpenMPコンパイラの試作
使用流计算优化的 FPGA OpenMP 编译器原型
遠隔手続き呼出しを用いたタスク並列モデルによるクラスタ連携に関する研究
基于远程过程调用的任务并行模型集群协作研究
Batched Kernel APIを用いるOpenMPタスク生成
使用批处理内核 API 生成 OpenMP 任务
SPGenのC言語フロントエンドによるループ最適化と性能評価
使用 SPGen 的 C 语言前端进行循环优化和性能评估
HPC向けストリームプロセッサ生成のためのC言語フロントエンドの開発
开发用于生成 HPC 流处理器的 C 语言前端

佐藤 三久的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 三久', 18)}}的其他基金

グリッドコンピューティング・ミドルウエアにおけるユーザ管理技法の研究
网格计算中间件用户管理技术研究
  • 批准号:
    06F06732
  • 财政年份:
    2006
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
計算物理学分野のGRIDアプリケーションと並列プログラミングシステムの研究
计算物理领域的GRID应用和并行编程系统研究
  • 批准号:
    15017210
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
計算物理学分野のGRIDアプリケーションと並列プログラミングシステムの研究
计算物理领域的GRID应用和并行编程系统研究
  • 批准号:
    14019011
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
計算物理学分野のGRIDアプリケーションと並列プログラミングシステムの研究
计算物理领域的GRID应用和并行编程系统研究
  • 批准号:
    13224010
  • 财政年份:
    2001
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
計算物理学分野のGRIDアプリケーションと並列プログラミングシステムの研究
计算物理领域的GRID应用和并行编程系统研究
  • 批准号:
    16016210
  • 财政年份:
    2001
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了