Collaborative Research: FMitF: Track I: DeepSmith: Scheduling with Quality Guarantees for Efficient DNN Model Execution
合作研究:FMitF:第一轨:DeepSmith:为高效 DNN 模型执行提供质量保证的调度
基本信息
- 批准号:2019306
- 负责人:
- 金额:$ 37.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The recent unprecedented growth of deep learning has led to rapid advances in a multitude of cutting-edge technologies such as computer vision, language translation, autonomous driving, and financial-fraud detection. However, realistic deep-learning models based on deep neural networks (DNNs) typically have substantial computational and memory requirements, which greatly limit their training and deployment in resource-constrained settings. The proposed research aims to employ formal methods to significantly improve the performance of DNN execution while providing useful quality guarantees that will enable a wider deployment of deep learning. This project will produce open-source software and conference tutorials to facilitate technology transfer and fruitful industry-academia interactions in a multidisciplinary community. This project proposes DeepSmith, a scheduling framework for efficient DNN model execution based on satisfiability modulo theories (SMT). The core of the proposed project includes a novel resource-constrained scheduling formulation with combined theories using SMT to exactly encode a rich set of performance and resource constraints, and a collection of advanced domain-specific SMT-solving algorithms. Moreover, a domain-specific programming language will be developed to enable the rapid development of exact scheduling using SMT and high code reusability. The resulting DeepSmith framework will allow productive exploration and deployment of SMT in DNN execution and potentially other optimization tasks in high-performance computing and hardware acceleration.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
最近深度学习的空前增长导致了计算机视觉、语言翻译、自动驾驶和金融欺诈检测等众多尖端技术的快速发展。然而,基于深度神经网络(DNN)的现实深度学习模型通常具有大量的计算和内存要求,这极大地限制了它们在资源受限环境中的训练和部署。拟议的研究旨在采用正式的方法来显着提高DNN执行的性能,同时提供有用的质量保证,使深度学习能够更广泛地部署。该项目将制作开源软件和会议教程,以促进多学科社区中的技术转让和富有成效的产学互动。该项目提出了DeepSmith,这是一种基于可满足性模理论(SMT)的高效DNN模型执行调度框架。该项目的核心包括一种新的资源约束调度公式,结合使用SMT的理论,精确地编码一组丰富的性能和资源约束,以及一系列先进的特定于领域的SMT求解算法。此外,将开发一种特定于领域的编程语言,以实现使用SMT和高代码重用性的精确调度的快速开发。由此产生的DeepSmith框架将允许在DNN执行中对SMT进行富有成效的探索和部署,并可能在高性能计算和硬件加速中执行其他优化任务。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Exact Memory- and Communication-aware Scheduling of DNNs on Pipelined Edge TPUs
- DOI:10.1109/sec54971.2022.00023
- 发表时间:2022-12
- 期刊:
- 影响因子:0
- 作者:Jiaqi Yin;Zhiru Zhang;Cunxi Yu
- 通讯作者:Jiaqi Yin;Zhiru Zhang;Cunxi Yu
Equality Saturation for Datapath Synthesis: A Pathway to Pareto Optimality
数据路径综合的等饱和:帕累托最优的途径
- DOI:10.1109/dac56929.2023.10247948
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Ustun, Ecenur;Yu, Cunxi;Zhang, Zhiru
- 通讯作者:Zhang, Zhiru
An Intermediate Language for General Sparse Format Customization
- DOI:10.1109/lca.2023.3262610
- 发表时间:2023-07
- 期刊:
- 影响因子:2.3
- 作者:Jie Liu-;Zhongyuan Zhao;Zijian Ding;Benjamin Brock;Hongbo Rong;Zhiru Zhang
- 通讯作者:Jie Liu-;Zhongyuan Zhao;Zijian Ding;Benjamin Brock;Hongbo Rong;Zhiru Zhang
IMpress: Large Integer Multiplication Expression Rewriting for FPGA HLS
- DOI:10.1109/fccm53951.2022.9786123
- 发表时间:2022-05
- 期刊:
- 影响因子:0
- 作者:Ecenur Ustun;Ismail San;Jiaqi Yin;Cunxi Yu;Zhiru Zhang
- 通讯作者:Ecenur Ustun;Ismail San;Jiaqi Yin;Cunxi Yu;Zhiru Zhang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhiru Zhang其他文献
Architecture and compilation for data bandwidth improvement in configurable embedded processors
可配置嵌入式处理器中数据带宽改进的架构和编译
- DOI:
10.5555/1129601.1129639 - 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
J. Cong;Guoling Han;Zhiru Zhang - 通讯作者:
Zhiru Zhang
Behavioral synthesis with activating unused flip-flops for reducing glitch power in FPGA
通过激活未使用的触发器来降低 FPGA 中的毛刺功率的行为综合
- DOI:
10.1109/aspdac.2008.4483919 - 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
C. Hsieh;J. Cong;Zhiru Zhang;Shih - 通讯作者:
Shih
OverQ: Opportunistic Outlier Quantization for Neural Network Accelerators
OverQ:神经网络加速器的机会离群值量化
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Ritchie Zhao;Jordan Dotzel;Zhanqiu Hu;Preslav Ivanov;Christopher De Sa;Zhiru Zhang - 通讯作者:
Zhiru Zhang
Experiences Using the RISC-V Ecosystem to Design an Accelerator-Centric SoC in TSMC 16nm
使用 RISC-V 生态系统在 TSMC 16nm 中设计以加速器为中心的 SoC 的经验
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
T. Ajayi;Khalid Al;Aporva Amarnath;Steve Dai;S. Davidson;Paul Gao;Gai Liu;Anuj Rao;A. Rovinski;Ning;Christopher Torng;Luis Vega;Bandhav Veluri;Shaolin Xie;Chun Zhao;Ritchie Zhao;C. Batten;R. Dreslinski;Rajesh K. Gupta;M. Taylor;Zhiru Zhang - 通讯作者:
Zhiru Zhang
Formal Verification of Source-to-Source Transformations for HLS
HLS 源到源转换的形式验证
- DOI:
10.1145/3626202.3637563 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
L. Pouchet;Emily Tucker;Niansong Zhang;Hongzheng Chen;Debjit Pal;Gabriel Rodríguez;Zhiru Zhang - 通讯作者:
Zhiru Zhang
Zhiru Zhang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhiru Zhang', 18)}}的其他基金
Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
- 批准号:
2403135 - 财政年份:2024
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Co-optimizing Spectral Algorithms and Systems for High-Performance Graph Learning
合作研究:SHF:中:协同优化高性能图学习的谱算法和系统
- 批准号:
2212371 - 财政年份:2022
- 资助金额:
$ 37.5万 - 项目类别:
Continuing Grant
SHF: Small: Architectural Synthesis for Programmable Accelerators
SHF:小型:可编程加速器的架构综合
- 批准号:
1909661 - 财政年份:2019
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
CAPA: Collaborative Research: A Multi-Paradigm Programming Infrastructure for Heterogeneous Architectures
CAPA:协作研究:异构架构的多范式编程基础设施
- 批准号:
1723715 - 财政年份:2017
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
STARSS: Small: Automatic Synthesis of Verifiably Secure Hardware Accelerators
STARSS:小型:自动合成可验证安全的硬件加速器
- 批准号:
1618275 - 财政年份:2016
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
CAREER: Synthesizing Highly Efficient Hardware Accelerators for Irregular Programs: A Synergistic Approach
职业:为不规则程序合成高效硬件加速器:一种协同方法
- 批准号:
1453378 - 财政年份:2015
- 资助金额:
$ 37.5万 - 项目类别:
Continuing Grant
相似国自然基金
复杂电子产品超精密加工及检测关键技术研究与应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于合成生物学的动物底盘品种优化及中试应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
运用组学整合技术探索萆薢分清散联合化疗治疗晚期胰腺癌的临床研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
九里香等提取物多靶向制剂抗肺癌的作用及机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
升血小板方治疗原发免疫性血小板减少症的临床研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
八髎穴微波热疗在女性膀胱过度活动症治疗中的价值研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于 miR-455-5p 介导的氧化应激机制探讨糖尿病视网膜病变中医分型治疗的临床研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于 UPLC-Q-TOF-MS/MS 分析的 异功散活性成分评价及提取工艺研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
无创电针对于痉挛型双瘫脑 瘫患儿的有效性与安全性研究:一项随机 单盲前瞻性队列研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
弹压式手法与体外冲击波治疗肱骨外上髁炎的对比研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
FMitF: Collaborative Research: RedLeaf: Verified Operating Systems in Rust
FMITF:协作研究:RedLeaf:经过验证的 Rust 操作系统
- 批准号:
2313411 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: DeepSmith: Scheduling with Quality Guarantees for Efficient DNN Model Execution
合作研究:FMitF:第一轨:DeepSmith:为高效 DNN 模型执行提供质量保证的调度
- 批准号:
2349461 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Game Theoretic Updates for Network and Cloud Functions
合作研究:FMitF:第一轨:网络和云功能的博弈论更新
- 批准号:
2318970 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Knitting Semantics
合作研究:FMitF:第一轨:针织语义
- 批准号:
2319182 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Towards Verified Robustness and Safety in Power System-Informed Neural Networks
合作研究:FMitF:第一轨:实现电力系统通知神经网络的鲁棒性和安全性验证
- 批准号:
2319242 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Towards Verified Robustness and Safety in Power System-Informed Neural Networks
合作研究:FMitF:第一轨:实现电力系统通知神经网络的鲁棒性和安全性验证
- 批准号:
2319243 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Synthesis and Verification of In-Memory Computing Systems using Formal Methods
合作研究:FMitF:第一轨:使用形式方法合成和验证内存计算系统
- 批准号:
2319400 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Synthesis and Verification of In-Memory Computing Systems using Formal Methods
合作研究:FMitF:第一轨:使用形式方法合成和验证内存计算系统
- 批准号:
2319399 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: Simplifying End-to-End Verification of High-Performance Distributed Systems
合作研究:FMitF:第一轨:简化高性能分布式系统的端到端验证
- 批准号:
2318954 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant
Collaborative Research: FMitF: Track I: The Phlox framework for verifying a high-performance distributed database
合作研究:FMitF:第一轨:用于验证高性能分布式数据库的 Phlox 框架
- 批准号:
2319167 - 财政年份:2023
- 资助金额:
$ 37.5万 - 项目类别:
Standard Grant