数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

批准号:
61502019
项目类别:
青年科学基金项目
资助金额:
22.0 万元
负责人:
杨海龙
依托单位:
学科分类:
F0204.计算机系统结构与硬件技术
结题年份:
2018
批准年份:
2015
项目状态:
已结题
项目参与者:
钱德沛、栾钟治、孟由、魏光、张佐玮、杨亚琪、汪逵、李慧娟
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
数据中心延迟敏感型应用对请求尾端响应时延服务质量有着极其严格的要求,然而请求的大规模并发、多阶段处理和系统状态的动态变化,都对请求处理的响应时延带来不确定性影响,从而对请求尾端响应时延的服务质量保障带来了新的挑战。本课题以延迟敏感型应用请求处理过程为线索,自顶向下依次探索应用层面、运行时层面和体系结构层面的响应时延缓解技术。在应用层面研究延迟感知的请求调配方法,选择满足服务质量要求的节点调度请求,避免节点不匹配严重拖长响应时延;在运行时层面研究面向服务质量的运行时管理机制,在线管控请求对系统资源使用的优先级和速率,缓解负载水平和计算行为变化等因素对响应时延的影响;在体系结构层面研究体系结构自适应的任务调度方法,在满足服务质量要求的基础上发挥不同体系结构特性的优势,改善数据中心的运行效率。同时通过不同层面间响应延迟缓解技术的有机结合,实现尾端响应时延服务质量保障的系统性解决方案。
英文摘要
Latency-sensitive applications running on top of datacenter computers require extremely strict QoS guarantee for tail latency responding to user requests. However, the large scale, multiple staged request processing as well as dynamic behaviors of the underlying system have introduced significant amount of variability to the response time per request, which becomes a new challenge to guarantee the QoS of tail latency for datacenter operators. After analyzing the procedure of the request processing, this project proposes a top-down approach regarding the application layer, runtime layer and architecture layer to explore the technologies alleviating the tail latency for latency-sensitive applications. At the application layer, study the methodologies of latency aware request scheduling and resource allocation in order to select the nodes satisfying the QoS requirement, which eliminates the incompatible nodes dragging the tail latency; at the runtime layer, manage the priority and rate of the request accessing the system resources, mitigating the latency fluctuation caused by load and computation phase change; at the architecture layer, study the methodologies of architecture adaptive request scheduling, leveraging the advantages of architecture features to satisfy the QoS of tail latency in addition to improve the efficiency of datacenter system. Moreover, through the combination of latency alleviation technologies from different layers, holistic solutions are derived to guarantee the QoS of tail latency for latency sensitive applications.
数据中心延迟敏感型应用对请求尾端响应时延服务质量有着极其严格的要求,然而请求的大规模并发、多阶段处理和系统状态的动态变化,都对请求处理的响应时延带来不确定性影响,从而对请求尾端响应时延的服务质量保障带来了新的挑战。本课题以延迟敏感型应用请求处理过程为线索,自顶向下依次探索应用层面、运行时层面和体系结构层面的响应时延缓解技术。在应用层面,研究了1) 多阶段应用的请求响应时延监控和瓶颈服务识别方法、2) 任务聚合下的GPU任务执行和数据传输建模方法、3) 细粒度GPU流多处理器资源模型;在运行时层面,研究了1) 功耗受限多阶段应用的自适应加速和功耗调整方法、2) 性能干扰感知的GPU应用聚合调度方法、3) 支持GPU资源预留和抢占的细粒度资源管理方法;在体系结构层面,1) 研究了改善应用线程并行度的GPU寄存器扩展方法、2) NUMA架构内访存延时平衡的内存分配方法、3) 适配申威众核体系结构的MapReduce计算框架。此外,还对性能瓶颈诊断工具开展了研究,包括1) 指导数据布局优化的轻量级评测工具、2) 针对大数据系统的性能瓶颈根源分析方法。通过不同层面间响应延迟缓解技术的有机结合,实现了尾端响应时延服务质量保障的系统性解决方案。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Improving Thread-level Parallelism in GPUs Through Expanding Register File to Scratchpad Memory
通过将寄存器文件扩展到暂存器内存来提高 GPU 中的线程级并行性
DOI:10.1145/3280849
发表时间:2018-11
期刊:Transactions on Architecture and Code Optimization (TACO)
影响因子:--
作者:Chao Yu;Yuebin Bai;Qingxiao Sun;Hailong Yang
通讯作者:Hailong Yang
T1000: Mitigating the memory footprint of convolution neural networks with decomposition and re-fusion
T1000:通过分解和重新融合减少卷积神经网络的内存占用
DOI:10.1016/j.future.2018.02.024
发表时间:2018-07
期刊:Future Generation Computer Systems
影响因子:--
作者:Changxi Liu;Hailong Yang;Rui Wang;Zhongzhi Luan;Depei Qian
通讯作者:Depei Qian
DOI:--
发表时间:2017
期刊:西安交通大学学报
影响因子:--
作者:王琳;钱德沛;王锐;栾钟治;魏光
通讯作者:魏光
SMGuard: A Flexible and Fine-Grained Resource Management Framework for GPUs
SMGuard:灵活且细粒度的 GPU 资源管理框架
DOI:10.1109/tpds.2018.2848621
发表时间:2018-12
期刊:IEEE Transactions on Parallel and Distributed Systems
影响因子:5.3
作者:Chao Yu;Yuebin Bai;Hailong Yang;Kun Cheng;Yuhao Gu;Zhongzhi Luan;Depei Qian
通讯作者:Depei Qian
swMR: A Framework for Accelerating MapReduce Applications on Sunway Taihulight
swMR:神威·太湖光上加速MapReduce应用的框架
DOI:10.1109/tetc.2018.2881265
发表时间:2021-04
期刊:Transactions on Emerging Topics in Computing
影响因子:--
作者:Xiaogang Zhong;Mingzhen Li;Hailong Yang;Yi Liu;Depei Qian
通讯作者:Depei Qian
高性能、高可扩展和高可移植的Stencil代码生成和优化框架研究
- 批准号:62072018
- 项目类别:面上项目
- 资助金额:57万元
- 批准年份:2020
- 负责人:杨海龙
- 依托单位:
国内基金
海外基金
