CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
基本信息
- 批准号:1910447
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2020-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Modern machine learning models have achieved great success and have been widely deployed across many sectors. As the size of data used to train machine learning models keeps growing, it is now routine to use distributed computing infrastructures such as the cloud. This strategy allows the computation of training to be distributed among a large number of nodes hosted in the cloud, where each node processes a partition of the whole data set. However, the performance of nodes in the cloud is often unreliable, due to system failures, resource contention, load imbalance, etc., and that unreliability can significantly delay the training process. This project pursues a coding-based framework that not only tolerates the effects of faulty nodes, but also further enhances the performance of machine learning training by dynamically taking advantage of the resources available on all nodes, whether they are faulty or not. The outcomes of this project should lead to a significant performance boost for distributed training of machine learning models.To enable the efficient use of distributed computing across unreliable infrastructure for training machine learning models from big data sets, the technical objectives of this project are divided into three levels. This project will first study coding theory for distributed matrix multiplication, a universal operation in various machine learning algorithms, and propose a coding framework with both fault tolerance and a significant performance boost. This framework will then be applied into parameter servers at the architecture level and deep neural networks at the model level, respectively. Combining these three parts, this work will lead to a practical coding framework that can efficiently scale out computation on heterogeneous unreliable nodes, where the coding schemes will be applied to distributed machine learning at different levels including fundamental arithmetic, architectures, and models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代机器学习模型取得了巨大成功,并已广泛应用于许多领域。随着用于训练机器学习模型的数据规模不断增长,使用云等分布式计算基础设施现在已成为惯例。该策略允许训练计算分布在云中托管的大量节点中,其中每个节点处理整个数据集的一部分。然而,由于系统故障、资源争用、负载不平衡等原因,云中节点的性能往往不可靠,并且这种不可靠性会显着延迟训练过程。该项目追求一种基于编码的框架,不仅可以容忍故障节点的影响,而且可以通过动态利用所有节点上的可用资源(无论是否故障)来进一步增强机器学习训练的性能。该项目的成果应该会显着提高机器学习模型的分布式训练的性能。为了能够跨不可靠的基础设施有效地使用分布式计算来训练来自大数据集的机器学习模型,该项目的技术目标分为三个层次。该项目将首先研究分布式矩阵乘法的编码理论,这是各种机器学习算法中的通用运算,并提出一种兼具容错性和显着性能提升的编码框架。然后,该框架将分别应用于架构级别的参数服务器和模型级别的深度神经网络。结合这三个部分,这项工作将产生一个实用的编码框架,可以有效地扩展异构不可靠节点上的计算,其中编码方案将应用于不同级别的分布式机器学习,包括基础算法、架构和模型。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查进行评估,被认为值得支持。 标准。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Local Re-encoding for Coded Matrix Multiplication
编码矩阵乘法的本地重新编码
- DOI:10.1109/isit44484.2020.9174041
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Su, Xian;Zhong, Xiaomei;Fan, Xiaodi;Li, Jun
- 通讯作者:Li, Jun
Straggler-free Coding for Concurrent Matrix Multiplications
- DOI:10.1109/isit44484.2020.9174239
- 发表时间:2020-06
- 期刊:
- 影响因子:0
- 作者:Pedro Soto;Jun Li
- 通讯作者:Pedro Soto;Jun Li
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jun Li其他文献
Upregulation of flotillin-1 promotes invasion and metastasis by activating TGF-β signaling in nasopharyngeal carcinoma
ïotillin-1 的上调通过激活 TGF-β 信号传导促进鼻咽癌的侵袭和转移
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Sumei Cao;Yanmei Cui;Huiming Xiao;Miaoqing Mai;Chanjuan Wang;Shanghang Xie;Jing Yang;Shu Wu;Jun Li;Libing Song;Xiang Guo;Chuyong Lin - 通讯作者:
Chuyong Lin
The utility of angiographic CT in the diagnosis and treatment of neurovascular pathologies in the vicinity of cranial base
血管造影CT在颅底附近神经血管病变诊治中的应用
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:2.8
- 作者:
Jun Li;Feng Wan;Gang Chen;Lianting Ma;Geng Zhang;Guo;J. Gong - 通讯作者:
J. Gong
d-Wave superconductivity via buckling-like phonon mode
通过类屈曲声子模式实现 d 波超导
- DOI:
10.1016/j.ssc.2004.10.030 - 发表时间:
2005 - 期刊:
- 影响因子:2.1
- 作者:
D. Tang;Jun Li;C. Gong - 通讯作者:
C. Gong
VLSI design of low-cost and high-precision fixed-point reconfigurable FFT processors
低成本高精度定点可重构FFT处理器的VLSI设计
- DOI:
10.1049/iet-cdt.2017.0060 - 发表时间:
2018-02 - 期刊:
- 影响因子:1.2
- 作者:
Hao Xiao;Xiang Yin;Ning Wu;Xin Chen;Jun Li;Xiaoxing Chen - 通讯作者:
Xiaoxing Chen
Out-of-plane dimeric MnIII quadridentate Schiff-base complexes: Synthesis, structure and magnetic properties
面外二聚 MnIII 四齿席夫碱配合物:合成、结构和磁性
- DOI:
10.1016/j.ica.2009.03.048 - 发表时间:
2009-08 - 期刊:
- 影响因子:0
- 作者:
Ya-Fan Zhao;Chao Wang;Qing-Lun Wang;Yu-Hua Feng;Daizheng Liao;Jun Li;Shi-Ping Yan - 通讯作者:
Shi-Ping Yan
Jun Li的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jun Li', 18)}}的其他基金
Integrated Multiscale Computational and Experimental Investigations on Fracture of Additively Manufactured Polymer Composites
增材制造聚合物复合材料断裂的综合多尺度计算和实验研究
- 批准号:
2309845 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Discovery Projects - Grant ID: DP210101100
发现项目 - 拨款 ID:DP210101100
- 批准号:
ARC : DP210101100 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Discovery Projects
Explore Electrocatalysis to Improve the Cathode Performance in Li-S Batteries
探索电催化提高锂硫电池正极性能
- 批准号:
2054754 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
- 批准号:
2101388 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Offline and Online Change-point Analysis for Large-scale Time Series Data
大规模时间序列数据的离线和在线变点分析
- 批准号:
1916239 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
A Novel Fuel Cell Catalyst and Support Architecture Based on Edge-site Pyridinic Nitrogen-Doping on Vertically Aligned Conical Carbon Nanofibers
基于垂直排列锥形碳纳米纤维边缘位吡啶氮掺杂的新型燃料电池催化剂和支撑结构
- 批准号:
1703263 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SUSCHEM: Exploring Specific Heating in Microwave-assisted Synthesis of Hierarchical Hybrid Nanomaterials for Future Sustainable Batteries
SUSCHEM:探索微波辅助合成未来可持续电池的分层混合纳米材料中的比热
- 批准号:
1707585 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
- 批准号:
1742644 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
TWC: Medium: Collaborative: Online Social Network Fraud and Attack Research and Identification
TWC:媒介:协作:在线社交网络欺诈和攻击研究与识别
- 批准号:
1564348 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
- 批准号:
1453287 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
- 批准号:
2327509 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
- 批准号:
2324396 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
- 批准号:
2327510 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
- 批准号:
2324397 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Fundamental Communication Latency Limits Beyond the Traditional Block-Coding Architecture
CIF:小:超越传统块编码架构的基本通信延迟限制
- 批准号:
2309887 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Interpretable Machine Learning based on Deep Neural Networks: A Source Coding Perspective
CIF:小:基于深度神经网络的可解释机器学习:源编码视角
- 批准号:
2205004 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Coding-theoretic methods in discrepancy and energy optimization, with applications
CIF:小:差异和能量优化中的编码理论方法及其应用
- 批准号:
2104489 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
- 批准号:
2101388 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Beyond Compressed Sensing: Analog Coding for Communications
合作研究:CIF:小型:超越压缩感知:通信模拟编码
- 批准号:
2007754 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Beyond Compressed Sensing: Analog Coding for Communications
合作研究:CIF:小型:超越压缩感知:通信模拟编码
- 批准号:
2007527 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant