CIF: Small: Coding Techniques for Distributed Machine Learning

CIF:小型:分布式机器学习的编码技术

基本信息

  • 批准号:
    1910447
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2020-12-31
  • 项目状态:
    已结题

项目摘要

Modern machine learning models have achieved great success and have been widely deployed across many sectors. As the size of data used to train machine learning models keeps growing, it is now routine to use distributed computing infrastructures such as the cloud. This strategy allows the computation of training to be distributed among a large number of nodes hosted in the cloud, where each node processes a partition of the whole data set. However, the performance of nodes in the cloud is often unreliable, due to system failures, resource contention, load imbalance, etc., and that unreliability can significantly delay the training process. This project pursues a coding-based framework that not only tolerates the effects of faulty nodes, but also further enhances the performance of machine learning training by dynamically taking advantage of the resources available on all nodes, whether they are faulty or not. The outcomes of this project should lead to a significant performance boost for distributed training of machine learning models.To enable the efficient use of distributed computing across unreliable infrastructure for training machine learning models from big data sets, the technical objectives of this project are divided into three levels. This project will first study coding theory for distributed matrix multiplication, a universal operation in various machine learning algorithms, and propose a coding framework with both fault tolerance and a significant performance boost. This framework will then be applied into parameter servers at the architecture level and deep neural networks at the model level, respectively. Combining these three parts, this work will lead to a practical coding framework that can efficiently scale out computation on heterogeneous unreliable nodes, where the coding schemes will be applied to distributed machine learning at different levels including fundamental arithmetic, architectures, and models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代机器学习模型已经取得了巨大的成功,并在许多领域得到了广泛的应用。随着用于训练机器学习模型的数据规模不断增长,现在使用云计算等分布式计算基础设施已成为常规。这种策略允许训练的计算分布在云中托管的大量节点中,其中每个节点处理整个数据集的一个分区。然而,云中节点的性能往往是不可靠的,由于系统故障、资源争用、负载不平衡等原因,并且这种不可靠性会显著地延迟训练过程。该项目追求一个基于编码的框架,不仅容忍故障节点的影响,而且通过动态利用所有节点上可用的资源(无论它们是否有故障)来进一步提高机器学习训练的性能。该项目的成果将显著提升机器学习模型分布式训练的性能。为了在不可靠的基础设施上有效使用分布式计算,从大数据集中训练机器学习模型,该项目的技术目标分为三个级别。该项目将首先研究分布式矩阵乘法的编码理论,这是各种机器学习算法中的通用操作,并提出一个具有容错性和显着性能提升的编码框架。然后,该框架将分别应用于架构级别的参数服务器和模型级别的深度神经网络。结合这三个部分,这项工作将导致一个实用的编码框架,可以有效地扩展异构不可靠节点上的计算,其中编码方案将应用于不同层次的分布式机器学习,包括基础算法,架构,该奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的评估支持影响审查标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Local Re-encoding for Coded Matrix Multiplication
编码矩阵乘法的本地重新编码
Straggler-free Coding for Concurrent Matrix Multiplications
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jun Li其他文献

Quantum Pure State Tomography via Variational Hybrid Quantum-Classical Method
通过变分混合量子经典方法进行量子纯态断层扫描
  • DOI:
    10.1103/physrevapplied.13.024013
  • 发表时间:
    2020-01
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Tao Xin;Xinfang Nie;Xiangyu Kong;Jingwei Wen;Dawei Lu;Jun Li
  • 通讯作者:
    Jun Li
Electrochemical, in-situ surface EXAFS and CTR studies of Co monolayers irreversibly adsorbed onto Pt(111)
Co 单层不可逆吸附在 Pt(111) 上的电化学、原位表面 EXAFS 和 CTR 研究
  • DOI:
    10.1016/s0013-4686(98)00362-4
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Herrero;Jun Li;H. Abruña
  • 通讯作者:
    H. Abruña
Attribute-based Blockchain Dynamic Failure Traceability in Multi-vendor Disaggregated Optical Networks
多供应商分解光网络中基于属性的区块链动态故障追踪
Target-free 3D tiny structural vibration measurement based on deep learning and motion magnification
基于深度学习和运动放大的无目标3D微小结构振动测量
  • DOI:
    10.1016/j.jsv.2022.117244
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    4.7
  • 作者:
    Yanda Shao;Lingjun Li;Jun Li;S. An;Hong Hao
  • 通讯作者:
    Hong Hao
Multiscale and Multiphysics Flow Simulations of Using the Boltzmann Equation
使用玻尔兹曼方程的多尺度和多物理场流动模拟
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jun Li
  • 通讯作者:
    Jun Li

Jun Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jun Li', 18)}}的其他基金

Integrated Multiscale Computational and Experimental Investigations on Fracture of Additively Manufactured Polymer Composites
增材制造聚合物复合材料断裂的综合多尺度计算和实验研究
  • 批准号:
    2309845
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Discovery Projects - Grant ID: DP210101100
发现项目 - 拨款 ID:DP210101100
  • 批准号:
    ARC : DP210101100
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Discovery Projects
Explore Electrocatalysis to Improve the Cathode Performance in Li-S Batteries
探索电催化提高锂硫电池正极性能
  • 批准号:
    2054754
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
  • 批准号:
    2101388
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Offline and Online Change-point Analysis for Large-scale Time Series Data
大规模时间序列数据的离线和在线变点分析
  • 批准号:
    1916239
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
A Novel Fuel Cell Catalyst and Support Architecture Based on Edge-site Pyridinic Nitrogen-Doping on Vertically Aligned Conical Carbon Nanofibers
基于垂直排列锥形碳纳米纤维边缘位吡啶氮掺杂的新型燃料电池催化剂和支撑结构
  • 批准号:
    1703263
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SUSCHEM: Exploring Specific Heating in Microwave-assisted Synthesis of Hierarchical Hybrid Nanomaterials for Future Sustainable Batteries
SUSCHEM:探索微波辅助合成未来可持续电池的分层混合纳米材料中的比热
  • 批准号:
    1707585
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
  • 批准号:
    1742644
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
TWC: Medium: Collaborative: Online Social Network Fraud and Attack Research and Identification
TWC:媒介:协作:在线社交网络欺诈和攻击研究与识别
  • 批准号:
    1564348
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
  • 批准号:
    1453287
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327510
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324397
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Fundamental Communication Latency Limits Beyond the Traditional Block-Coding Architecture
CIF:小:超越传统块编码架构的基本通信延迟限制
  • 批准号:
    2309887
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Interpretable Machine Learning based on Deep Neural Networks: A Source Coding Perspective
CIF:小:基于深度神经网络的可解释机器学习:源编码视角
  • 批准号:
    2205004
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Coding-theoretic methods in discrepancy and energy optimization, with applications
CIF:小:差异和能量优化中的编码理论方法及其应用
  • 批准号:
    2104489
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
  • 批准号:
    2101388
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Beyond Compressed Sensing: Analog Coding for Communications
合作研究:CIF:小型:超越压缩感知:通信模拟编码
  • 批准号:
    2007754
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Beyond Compressed Sensing: Analog Coding for Communications
合作研究:CIF:小型:超越压缩感知:通信模拟编码
  • 批准号:
    2007527
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了