基于进程相似性的大规模并行程序在线可扩展分析方法研究
批准号:
61103021
项目类别:
青年科学基金项目
资助金额:
24.0 万元
负责人:
翟季冬
依托单位:
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2014
批准年份:
2011
项目状态:
已结题
项目参与者:
陈文光、何江舟、刘明亮、肖天、蒋运韫、翟琰、刘迪、张宏
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
高性能计算机的硬件已经进入千万亿次计算时代,但是,大量重要的科学应用程序尚未扩展到相应的计算平台。并行程序可扩展分析技术能够帮助应用开发人员定位并行程序性能瓶颈,改进程序的可扩展性。然而,随着系统规模的逐渐增大,现有可扩展分析方法产生的性能数据已经远超出当前的I/O处理能力,使其无法帮助程序应用到拥有数十万个核的高性能计算平台,这较大地限制了高性能计算领域的发展。针对上述问题,本课题研究工作包括:首先,研究大规模并行程序进程间计算和通信模式的相似性,提出基于通信类型序列和函数调用图的轻量级方式对进程分组,选取代表进程进行性能分析;其次,提出静动态结合的大规模并行程序通信Traces压缩算法,改进现有压缩技术完全动态时猜测通信结构较高的处理开销;最后,提出基于虚拟重叠网络和进程间删冗的在线性能数据采集和分析方法,定位程序的可扩展性瓶颈,改进现有方法较大的离线存储和处理开销。
英文摘要
高性能计算机的系统规模持续增大,但是,大量重要的科学计算程序尚未扩展到相应的计算平台。缺少有效的大规模并行程序性能分析和优化工具是制约并行程序可扩展性的主要原因。本项目针对目前并行程序性能分析和优化工具面临的问题和挑战开展研究。主要研究成果包括以下几点:(1)设计并实现了基于硬件计数器的轻量级并行程序性能分析系统。该系统可以在线收集大规模并行程序计算和通信相关的性能数据,并分析程序的性能瓶颈,给出优化建议。(2)对典型应用程序计算和通信特征分析。本项目采用自主研发的性能采集和分析工具分析了国产天气预报程序的计算模式、通信模式和负载均衡等,并给出详细的分析报告。(3)在云平台上分析并行程序的可扩展性并验证了系统的健壮性。本项目采用研制的性能分析工具分析了NPB测试程序集在亚马逊云平台上的可扩展性。对不同问题规模和系统规模下程序的可扩展性进行了分析和研究。(4)研究基于静动态结合的通信记录压缩系统。本项目设计并实现了一个基于静态和动态方法混合的大规模并行程序通信记录压缩算法。该方法和动态压缩技术相比,可以减少5倍的进程内压缩开销和9倍的进程间压缩开销。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2013
期刊:计算机学报
影响因子:--
作者:刘迪;翟季冬;陈文光
通讯作者:陈文光
DOI:--
发表时间:--
期刊:计算机学报
影响因子:--
作者:刘迪;翟季冬;陈文光
通讯作者:陈文光
基于多面体模型的深度学习张量编译器
- 批准号:U20A20226
- 项目类别:联合基金项目
- 资助金额:260万元
- 批准年份:2020
- 负责人:翟季冬
- 依托单位:
面向高性能云平台的并行程序优化关键技术研究
- 批准号:61472201
- 项目类别:面上项目
- 资助金额:84.0万元
- 批准年份:2014
- 负责人:翟季冬
- 依托单位:
国内基金
海外基金















{{item.name}}会员


