CAREER: Learning-Based Hardware and Software Techniques for Quality-of-Service-Aware Cloud Microservices

职业:基于学习的硬件和软件技术,用于服务质量感知的云微服务

基本信息

项目摘要

Datacenters support a large and ever-increasing fraction of the world's digital computation power, including search engines, social networks, and machine learning analytics. As modern cloud services grow in popularity, their design shifts from supporting complex monolithic applications, to supporting collections of specialized, loosely-coupled microservices. Such microservices impact resource requirements by requiring fast network processing and low-latency memory accesses to achieve their quality-of-service (QoS) constraints. Dependencies among microservices also complicate compute cluster management, and can cause cascading QoS violations, hurting availability and service reliability. Guaranteeing the responsiveness expected from cloud services while using datacenters efficiently requires instead a joint hardware-software approach. This project takes a holistic view towards designing a system stack for interactive cloud microservices running on large-scale datacenters that is QoS-aware, and resource-efficient. By pursuing automated, learning-based techniques, this project highlights the value of leveraging practical machine learning techniques to better navigate the increasing complexity of the cloud, as more datacenter services switch to this new application model.At the hardware level, this project first quantifies the implications microservices have on server design, and second, explores their potential for hardware acceleration. At the software level, this work is developing a new cluster manager that accounts for the dependencies among microservices in an automated and transparent-to-the-user way, and guarantees end-to-end performance. Finally, to eliminate the cascading effects of QoS violations between microservices, this project includes a data-driven, online performance forecasting system. This system leverages the massive amount of monitoring data collected by cloud systems to anticipate upcoming QoS violations, and act on them before they degrade performance. By innovating in both hardware and software, this work will achieve performance and efficiency gains that neither hardware- nor software-only approaches can provide.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据中心支持世界数字计算能力的一个巨大且不断增长的部分,包括搜索引擎、社交网络和机器学习分析。随着现代云服务越来越受欢迎,其设计从支持复杂的单体应用程序转变为支持专门的松散耦合微服务集合。这些微服务通过要求快速网络处理和低延迟内存访问来实现其服务质量(QoS)约束,从而影响资源需求。微服务之间的重复性也使计算集群管理复杂化,并可能导致级联QoS违规,从而损害可用性和服务可靠性。在高效使用云计算中心的同时,确保云服务的响应速度,需要采用软硬件联合的方法。该项目从整体上设计了一个系统堆栈,用于在大规模网络中心上运行的交互式云微服务,该系统堆栈具有QoS感知和资源效率。随着越来越多的数据中心服务转向这种新的应用模式,该项目通过追求基于学习的自动化技术,强调了利用实用机器学习技术更好地驾驭云计算日益复杂性的价值。在硬件层面,该项目首先量化了微服务对服务器设计的影响,其次,探索了它们在硬件加速方面的潜力。在软件层面,这项工作正在开发一个新的集群管理器,以自动化和对用户的兼容性的方式解释微服务之间的依赖关系,并保证端到端的性能。最后,为了消除微服务之间QoS违规的级联效应,该项目包括一个数据驱动的在线性能预测系统。该系统利用云系统收集的大量监控数据来预测即将发生的QoS违规,并在它们降低性能之前对其采取行动。通过在硬件和软件方面的创新,这项工作将实现单纯的硬件和软件方法都无法提供的性能和效率提升。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christina Delimitrou其他文献

Leveraging Approximation to Improve Resource Efficiency in the Cloud
利用近似提高云中的资源效率
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Neeraj Kulkarni;Feng Qi;G. Fernando;Christina Delimitrou
  • 通讯作者:
    Christina Delimitrou
Mage: Online Interference-Aware Scheduling in Multi-Scale Heterogeneous Systems
Mage:多尺度异构系统中的在线干扰感知调度
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Francisco Romero;Christina Delimitrou
  • 通讯作者:
    Christina Delimitrou
Sage: Practical & Scalable ML-Driven Performance Debugging in Microservices
圣人:实用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yu Gan;Mingyu Liang;Sundar Dev;David Lo;Christina Delimitrou
  • 通讯作者:
    Christina Delimitrou
Dagger: Efficient and Fast RPCs for Cloud Microservices with Near-Memory Reconfigurable NICs Extended
Dagger:用于云微服务的高效、快速 RPC,具有扩展的近内存可重配置 NIC
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N. Lazarev;Shaojie Xiang;Neil Adit;Zhiru Zhang;Christina Delimitrou
  • 通讯作者:
    Christina Delimitrou
Mage: online and interference-aware scheduling for multi-scale heterogeneous systems
Mage:多尺度异构系统的在线和干扰感知调度

Christina Delimitrou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christina Delimitrou', 18)}}的其他基金

CAREER: Learning-Based Hardware and Software Techniques for Quality-of-Service-Aware Cloud Microservices
职业:基于学习的硬件和软件技术,用于服务质量感知的云微服务
  • 批准号:
    1846046
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Data-Enabled Neural Multi-Step Predictive Control (DeMuSPc): a Learning-Based Predictive and Adaptive Control Approach for Complex Nonlinear Systems
职业:数据支持的神经多步预测控制(DeMuSPc):一种用于复杂非线性系统的基于学习的预测和自适应控制方法
  • 批准号:
    2338749
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Mitigating the Lack of Labeled Training Data in Machine Learning Based on Multi-level Optimization
职业:基于多级优化缓解机器学习中标记训练数据的缺乏
  • 批准号:
    2339216
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Facilitating Autonomy of Robots Through Learning-Based Control
职业:通过基于学习的控制促进机器人的自主性
  • 批准号:
    2422698
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Integrating Graph Theory based Networks with Machine Learning for Enhanced Process Synthesis and Design
职业:将基于图论的网络与机器学习相集成以增强流程综合和设计
  • 批准号:
    2339588
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: End-to-End Active Region-based Heliospheric Forecasting System Using Multi-spacecraft Data and Machine Learning
职业:使用多航天器数据和机器学习的基于端对端活动区域的日光层预报系统
  • 批准号:
    2240022
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Combining Machine Learning and Physics-based Modeling Approaches for Accelerating Scientific Discovery
职业:结合机器学习和基于物理的建模方法来加速科学发现
  • 批准号:
    2239175
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Reinforcement Learning-Based Control of Heterogeneous Multi-Agent Systems in Structured Environments: Algorithms and Complexity
职业:结构化环境中异构多智能体系统的基于强化学习的控制:算法和复杂性
  • 批准号:
    2237830
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Continuous Flow Chemistry of Microelectronics Polymers via Combined Physics-based and Machine Learning Models
职业:通过基于物理和机器学习相结合的微电子聚合物的连续流动化学
  • 批准号:
    2238147
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
PBS NewsHour STEM StoryMaker: Project-based learning for youth health literacy and biomedical career awareness through journalism and storytelling
PBS NewsHour STEM StoryMaker:通过新闻和讲故事提高青少年健康素养和生物医学职业意识的项目式学习
  • 批准号:
    10665423
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
CAREER: Efficient, Dynamic, Robust, and On-Device Continual Deep Learning with Non-Volatile Memory based In-Memory Computing System
职业:使用基于非易失性内存的内存计算系统进行高效、动态、鲁棒、设备上持续深度学习
  • 批准号:
    2342726
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了