CRII: CSR: Mitigating Tail Latency in Prediction-serving Systems using Coding-theoretic Tools

CRII:CSR:使用编码理论工具减轻预测服务系统中的尾部延迟

基本信息

  • 批准号:
    1850483
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-03-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

Prediction-serving systems take in queries and return predictions from a machine learning model. For example, an image classification service would take an image as a query and respond with a prediction of whether there is a car in the image. Prediction-serving systems are increasingly important for a wide variety of applications today. These systems are typically run in large-scale computing infrastructures, where failures and slowdowns are common. Such unavailability results in significant increase in the query-response latency, thereby degrading the quality-of-service. The research project designs and implements a resource-efficient solution for robustness in prediction-serving systems using a tool from the domain of coding theory called "erasure-coded computation".The overarching goal of the project is to design and implement a solution for reducing the potential long latency in prediction-serving systems using erasure-coded computations. The project overcomes critical limitations in existing coded-computation solutions by employing machine learning in a novel way. Specifically, the project involves the following key tasks: (1) Designing a low-overhead coded-computation solution that efficiently supports complex non-linear functions by employing a learning-based approach; (2) Designing an efficient training methodology conforming to the constraints of real-world prediction-serving systems; and (3) System design and implementation.The software resulting from the project will be integrated into open-source prediction-serving systems for use in both research and education. Active engagement in promoting diversity in science, technology, engineering and mathematics disciplines and undergraduate mentorship will be continued. The findings from the project will be integrated into graduate and undergraduate courses in computer science.The results from the research project, including software, will be made available at http://www.cs.cmu.edu/~rvinayak/crii .This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
预测服务系统接受查询并从机器学习模型返回预测。例如,图像分类服务会将图像作为查询,并预测图像中是否有汽车作为响应。预测服务系统对于当今的各种应用越来越重要。这些系统通常在大规模计算基础设施中运行,其中故障和速度缓慢很常见。这种不可用性会导致查询响应延迟显着增加,从而降低服务质量。该研究项目使用编码理论领域称为“纠删码计算”的工具,设计并实现了一种资源高效的解决方案,以实现预测服务系统的鲁棒性。该项目的总体目标是设计和实现一种解决方案,以减少使用纠删码计算的预测服务系统中潜在的长延迟。该项目通过以新颖的方式采用机器学习,克服了现有编码计算解决方案的关键限制。具体来说,该项目涉及以下关键任务:(1)设计一种低开销的编码计算解决方案,通过采用基于学习的方法有效支持复杂的非线性函数; (2)设计符合现实世界预测服务系统约束的高效训练方法; (3) 系统设计和实现。该项目产生的软件将被集成到开源预测服务系统中,用于研究和教育。将继续积极参与促进科学、技术、工程和数学学科的多样性以及本科生导师制。该项目的研究结果将被纳入计算机科学研究生和本科生课程中。该研究项目的结果(包括软件)将在 http://www.cs.cmu.edu/~rvinayak/crii 上提供。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parity models: erasure-coded resilience for prediction serving systems
Learning-Based Coded Computation
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rashmi Vinayak其他文献

Rashmi Vinayak的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rashmi Vinayak', 18)}}的其他基金

CAREER: Coding Theory for Efficient Data Centers via Redundancy Adaptation
职业:通过冗余适应实现高效数据中心的编码理论
  • 批准号:
    1943409
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
CIF: Small: Coding for Live Delay-constrained Streaming Communication
CIF:小型:实时延迟约束流通信的编码
  • 批准号:
    1910813
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CNS Core:Medium:Collaborative Research:Towards Enabling Optimal Performance-Cost Tradeoffs in Distributed Storage
CNS 核心:中:协作研究:实现分布式存储中的最佳性能与成本权衡
  • 批准号:
    1901410
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于经筋理论的筋针与整脊联合疗法治疗 CSR疼痛的临床应用研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
RAC2(G15D)突变参与B细胞 Ig-CSR过程的分子机制研究
  • 批准号:
    2025JJ80630
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于CRISPR/CasRx调控CSR1基因表达预防氨基糖甙类耳毒性聋研究
  • 批准号:
    2024Y9183
  • 批准年份:
    2024
  • 资助金额:
    25.0 万元
  • 项目类别:
    省市级项目
基于Piezo机械敏感通道探讨奉伸松调法调控颈肌细胞自噬与DRG痛觉感受神经元可塑性治疗CSR的作用机制
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    地区科学基金项目
准社会互动视角下CSR数字化沟通对品牌绩效的差异化影响、机制与管理对策
  • 批准号:
    72362008
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
善行得善果?后疫情时代嵌入式和边缘式CSR对员工幸福感的跨层影响研究
  • 批准号:
    72102183
  • 批准年份:
    2021
  • 资助金额:
    24.00 万元
  • 项目类别:
    青年科学基金项目
善行得善果?后疫情时代嵌入式和边缘式CSR对员工幸福感的跨层影响研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
基于脊髓突触可塑性探讨“调气”电针远端腧穴干预CSR模型大鼠的中枢镇痛效应及机制研究
  • 批准号:
    82160934
  • 批准年份:
    2021
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目
利用输运模型和机器学习方法研究CSR能区的低温高密核物质
  • 批准号:
    U2032145
  • 批准年份:
    2020
  • 资助金额:
    50.0 万元
  • 项目类别:
    联合基金项目
PPR家族蛋白CSR3调控拟南芥叶绿体RNA剪接的分子机理
  • 批准号:
    32000184
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
  • 批准号:
    2348457
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Bridging Economic Demands with Social Responsibility: A Deep Dive into SMFDI's Production-Driven CSR Initiatives
连接经济需求与社会责任:深入探讨 SMFDI 的生产驱动型企业社会责任计划
  • 批准号:
    24K20993
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CRII: CSR: Towards an Edge-enabled Software-Defined Vehicle Framework for Dynamic Over-the-Air Updates
CRII:CSR:迈向支持边缘的软件定义车辆框架,用于动态无线更新
  • 批准号:
    2348151
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
サステナブルなCSRとブランド価値:真正性・整合性・一体感に着目した国際比較研究
可持续企业社会责任与品牌价值:关注真实性、完整性和团结感的国际比较研究
  • 批准号:
    24K05139
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CSR, premiums and cross-border M&A
企业社会责任、保费和跨境M
  • 批准号:
    24K00283
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CRII: CSR: Adaptive Federated Continuous Learning on Heterogeneous Edge Devices with Unlabeled Data
CRII:CSR:具有未标记数据的异构边缘设备的自适应联合连续学习
  • 批准号:
    2348279
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: CSR: Enabling On-Device Continual Learning through Enhancing Efficiency of Computing, Memory, and Data
CRII:CSR:通过提高计算、内存和数据的效率实现设备上的持续学习
  • 批准号:
    2348376
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CSR: Small: Latency-controlled Reduction of Data Center Expenses for Handling Bursty ML Inference Requests
CSR:小:通过延迟控制减少数据中心处理突发 ML 推理请求的费用
  • 批准号:
    2336886
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了