CNS Core: Small: A Multi-Stakeholder Integrated Approach to Reduce Tail Latency Using Heterogeneity
CNS 核心:小型:利用异构性减少尾部延迟的多利益相关者集成方法
基本信息
- 批准号:1909004
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
There are many different types of computer hardware. Examples include mobile cell phone processors, machine learning accelerators, traditional server processors, gaming platforms, and so forth, but these resources are specialized and primarily utilized within a single domain. As cloud computing providers broaden their markets and start offering more types of hardware, it opens an opportunity to design heterogeneity-aware computing systems, which combine different types of resources that are synergistic. This research will investigate techniques for intentionally utilizing heterogeneity as a controllable parameter for improving performance. Specifically, the research will focus on the tail latency performance metric, which has been identified by industry as an important performance metric affecting the responsiveness of user-facing Internet services. To deploy and harness the right heterogeneity at the right time, this research will consider the unique problems faced by three key stakeholders (Application Deployer, Resource Manager, and Infrastructure Provider). From the Application Deployer's perspective, the research will consider how to decompose an application into phases/sub-components that can benefit from different types of resources. From the Resource Manager's perspective, the research will determine the right quantity and mixture of resource types as well as how to schedule across these resources to minimize tail latency. From the Infrastructure Provider's perspective, the research will consider issues arising from sharing a mixture of different resources between multiple applications. Additionally, the research will leverage cross-stakeholder information towards a unified strategy for deploying and harnessing heterogeneity.This research will be applicable to both providers of data centers, such as cloud providers, as well as businesses that use that infrastructure. For the provider, the research can improve the performance and lower the cost of data centers, which are critical components of the national infrastructure and economy. For the user, the research can enable emerging interactive applications, such as complex data analytics and real-time machine learning, to achieve high performance at low cost. This research promotes using diverse mixtures of resources, which could spur the development of new types of hardware and software. In addition to the broader research impacts, there is a plan to enhance the undergraduate and graduate courses with ideas and software generated by this research.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
有许多不同类型的计算机硬件。例子包括移动手机处理器、机器学习加速器、传统服务器处理器、游戏平台等等,但这些资源都是专门的,主要在单个领域内使用。随着云计算提供商扩大其市场并开始提供更多类型的硬件,它为设计异构感知计算系统提供了机会,这些系统可以结合不同类型的协同资源。本研究将探讨有意利用异质性作为提高性能的可控参数的技术。具体而言,研究将集中在尾部延迟性能指标上,该指标已被业界确定为影响面向用户的互联网服务响应性的重要性能指标。为了在正确的时间部署和利用正确的异构性,本研究将考虑三个关键涉众(应用程序部署者、资源管理器和基础设施提供者)所面临的独特问题。从应用程序部署者的角度来看,该研究将考虑如何将应用程序分解为可以从不同类型的资源中受益的阶段/子组件。从资源管理器的角度来看,研究将确定资源类型的正确数量和混合,以及如何跨这些资源调度以最小化尾部延迟。从基础设施提供商的角度来看,该研究将考虑在多个应用程序之间共享不同资源的混合所产生的问题。此外,该研究将利用跨利益相关者的信息来制定统一的战略,以部署和利用异质性。这项研究既适用于数据中心的提供商,如云提供商,也适用于使用该基础设施的企业。数据中心是国家基础设施和经济的重要组成部分,对于提供商来说,研究可以提高数据中心的性能并降低成本。对于用户来说,这项研究可以使新兴的交互式应用,如复杂的数据分析和实时机器学习,以低成本实现高性能。这项研究提倡使用不同的资源组合,这可能会刺激新型硬件和软件的发展。除了更广泛的研究影响之外,还有一个计划是用这项研究产生的想法和软件来增强本科和研究生课程。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Overflowing emerging neural network inference tasks from the GPU to the CPU on heterogeneous servers
- DOI:10.1145/3534056.3534935
- 发表时间:2022-06
- 期刊:
- 影响因子:0
- 作者:Adithya Kumar;A. Sivasubramaniam;T. Zhu
- 通讯作者:Adithya Kumar;A. Sivasubramaniam;T. Zhu
Kerveros: Efficient and Scalable Cloud Admission Control
Kerveros:高效且可扩展的云准入控制
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Sajal, Sultan Mahmud;Marshall, Luke;Li, Beibin;Zhou, Shandan;Pan, Abhisek;Mellou, Konstantina;Narayanan, Deepak;Zhu, Timothy;Dion, David;Moscibroda, Thomas
- 通讯作者:Moscibroda, Thomas
SplitRPC: A {Control + Data} Path Splitting RPC Stack for ML Inference Serving
- DOI:10.1145/3589974
- 发表时间:2023-05
- 期刊:
- 影响因子:0
- 作者:Adithya Kumar;A. Sivasubramaniam;T. Zhu
- 通讯作者:Adithya Kumar;A. Sivasubramaniam;T. Zhu
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Timothy Zhu其他文献
TraceUpscaler: Upscaling Traces to Evaluate Systems at High Load
TraceUpscaler:升级跟踪以评估高负载下的系统
- DOI:
10.1145/3627703.3629581 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Sultan Mahmud Sajal;Timothy Zhu;Bhuvan Urgaonkar;Siddhartha Sen - 通讯作者:
Siddhartha Sen
Timothy Zhu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Timothy Zhu', 18)}}的其他基金
Collaborative Research: DESC: Type I: Extending lifetimes of partially broken machines to repurpose e-waste
合作研究:DESC:类型 I:延长部分损坏机器的使用寿命以重新利用电子垃圾
- 批准号:
2324858 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Auto-generated experimentation for performance diagnosis of distributed systems
职业:自动生成分布式系统性能诊断实验
- 批准号:
2239291 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
胆固醇羟化酶CH25H非酶活依赖性促进乙型肝炎病毒蛋白Core及Pre-core降解的分子机制研究
- 批准号:82371765
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
锕系元素5f-in-core的GTH赝势和基组的开发
- 批准号:22303037
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于合成致死策略搭建Core-matched前药共组装体克服肿瘤耐药的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:
鼠伤寒沙门氏菌LPS core经由CD209/SphK1促进树突状细胞迁移加重炎症性肠病的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于外泌体精准调控的“核-壳”(core-shell)同步血管化骨组织工程策略的应用与机制探讨
- 批准号:
- 批准年份:2020
- 资助金额:55 万元
- 项目类别:
肌营养不良蛋白聚糖Core M3型甘露糖肽的精确制备及功能探索
- 批准号:92053110
- 批准年份:2020
- 资助金额:70.0 万元
- 项目类别:重大研究计划
Core-1-O型聚糖黏蛋白缺陷诱导胃炎发生并介导慢性胃炎向胃癌转化的分子机制研究
- 批准号:81902805
- 批准年份:2019
- 资助金额:20.5 万元
- 项目类别:青年科学基金项目
原始地球增生晚期的Core-merging大碰撞事件:地核增生、核幔平衡与核幔边界结构的新认识
- 批准号:41973063
- 批准年份:2019
- 资助金额:65.0 万元
- 项目类别:面上项目
RBM38通过协助Pol-ε结合、招募core调控HBV复制
- 批准号:31900138
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
CORDEX-CORE区域气候模拟与预估研讨会
- 批准号:41981240365
- 批准年份:2019
- 资助金额:1.5 万元
- 项目类别:国际(地区)合作与交流项目
相似海外基金
CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
- 批准号:
2322919 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
- 批准号:
2343469 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
- 批准号:
2317698 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Repurposing Smartphones to Minimize Carbon
CNS 核心:小型:重新利用智能手机以最大限度地减少碳排放
- 批准号:
2233894 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
- 批准号:
2230945 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: NSF-AoF: CNS Core: Small: Towards Scalable and Al-based Solutions for Beyond-5G Radio Access Networks
合作研究:NSF-AoF:CNS 核心:小型:面向超 5G 无线接入网络的可扩展和基于人工智能的解决方案
- 批准号:
2225578 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Toward Opportunistic, Fast, and Robust In-Cache AI Acceleration at the Edge
CNS 核心:小型:在边缘实现机会主义、快速且稳健的缓存内 AI 加速
- 批准号:
2228028 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: SmartSight: an AI-Based Computing Platform to Assist Blind and Visually Impaired People
合作研究:中枢神经系统核心:小型:SmartSight:基于人工智能的计算平台,帮助盲人和视障人士
- 批准号:
2418188 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CNS Core: Small: Redesigning I/O Across Heterogeneous Systems
CNS 核心:小型:跨异构系统重新设计 I/O
- 批准号:
2231724 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: Creating An Extensible Internet Through Interposition
合作研究:CNS核心:小:通过介入创建可扩展的互联网
- 批准号:
2242503 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant