SHF: Small: NPU-based Architecture for Accelerating Deep Learning on Mobile Devices
SHF:小型:基于 NPU 的架构,用于加速移动设备上的深度学习
基本信息
- 批准号:2125208
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The rapid progress of deep-learning techniques has enabled many emerging artificial intelligence applications (e.g., augmented reality), and there is a tremendous demand for running these applications on mobile devices. However, deep-learning models are by nature computationally intensive, making them challenging to deploy on battery-powered mobile devices. This project systematically investigates the fundamental and challenging issues for running deep-learning applications on mobile devices by designing a mobile architecture based on Neural Processing Units (NPUs). An NPU is a microprocessor that specializes in the acceleration of deep-learning algorithms; however, it incurs accuracy loss, and it is a challenge to address this problem. This research identifies some special characteristics of running deep-learning models on NPUs and leverages such findings to design novel techniques to maximize accuracy or minimize processing time based on the application requirements. As deep learning has been successfully applied to various problems in people's daily lives, this project has great potential to benefit society by improving the performance, the energy efficiency, and the quality of running deep-learning applications on mobile devices. This project is also contributing to society through developing new curricula, disseminating research for education and training, engaging under-represented students in research, and outreaching to high-school students.The primary goal of this project is to design an NPU-based architecture for accelerating deep learning that can address the accuracy-loss problem of NPUs as well as the energy and performance limitations of current mobile architectures. The project consists of three tasks: (1) investigating model-partitioning techniques to decompose the deep-learning model into different layers running on heterogeneous processors to minimize processing time or maximize accuracy based on the application requirements; (2) designing energy-and thermal-aware architectures to address the performance limitations of the current mobile architecture, by exploring techniques to decompose the computation between heterogeneous processors to avoid overheating; (3) exploring the collaborative intelligence among edge/servers, hardware accelerators, and NPU-based architectures to optimize performance, by investigating how and where to run the computation based on the confidence level of executing deep learning models on an NPU.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度学习技术的快速发展使许多新兴的人工智能应用成为可能(例如,增强现实),并且存在在移动的设备上运行这些应用的巨大需求。然而,深度学习模型本质上是计算密集型的,这使得它们在电池供电的移动的设备上部署具有挑战性。该项目通过设计基于神经处理单元(NPU)的移动的架构,系统地研究了在移动的设备上运行深度学习应用程序的基本问题和挑战性问题。NPU是一种专门用于加速深度学习算法的微处理器;然而,它会导致精度损失,解决这个问题是一个挑战。这项研究确定了在NPU上运行深度学习模型的一些特殊特征,并利用这些发现来设计新的技术,以根据应用需求最大限度地提高准确性或最大限度地减少处理时间。由于深度学习已成功应用于人们日常生活中的各种问题,因此该项目具有巨大的潜力,可以通过提高移动的设备上运行深度学习应用程序的性能,能源效率和质量来造福社会。该项目还通过开发新课程、传播教育和培训研究成果、让代表性不足的学生参与研究以及向高中生推广等方式为社会做出贡献。该项目的主要目标是设计一种基于NPU的架构,以加速深度学习,解决NPU的准确性损失问题以及当前移动的架构的能源和性能限制。该项目包括三个任务:(1)研究模型划分技术,将深度学习模型分解为在异构处理器上运行的不同层,以根据应用需求最大限度地减少处理时间或最大限度地提高准确性;(2)设计能量和热感知架构以解决当前移动的架构的性能限制,探索异构处理器之间的计算分解技术,避免计算过热;(3)探索边缘/服务器、硬件加速器和基于NPU的架构之间的协作智能以优化性能,该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Macrotile: Toward QoE-Aware and Energy-Efficient 360-Degree Video Streaming
- DOI:10.1109/tmc.2022.3233022
- 发表时间:2024-02
- 期刊:
- 影响因子:7.9
- 作者:Xianda Chen;Tianxiang Tan;Guohong Cao
- 通讯作者:Xianda Chen;Tianxiang Tan;Guohong Cao
Deep Learning on Mobile Devices Through Neural Processing Units and Edge Computing
- DOI:10.1109/infocom48880.2022.9796929
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:Tianxiang Tan;G. Cao
- 通讯作者:Tianxiang Tan;G. Cao
Deep Learning on Mobile Devices With Neural Processing Units
- DOI:10.1109/mc.2022.3215780
- 发表时间:2023-08
- 期刊:
- 影响因子:2.2
- 作者:Tianxiang Tan;Guohong Cao
- 通讯作者:Tianxiang Tan;Guohong Cao
Energy-Efficient 360-Degree Video Streaming on Multicore-Based Mobile Devices
- DOI:10.1109/infocom53939.2023.10228863
- 发表时间:2023-05
- 期刊:
- 影响因子:0
- 作者:Xianda Chen;Guohong Cao
- 通讯作者:Xianda Chen;Guohong Cao
Deep Learning Video Analytics Through Edge Computing and Neural Processing Units on Mobile Devices
- DOI:10.1109/tmc.2021.3105953
- 发表时间:2021-08
- 期刊:
- 影响因子:7.9
- 作者:Tianxiang Tan;G. Cao
- 通讯作者:Tianxiang Tan;G. Cao
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Guohong Cao其他文献
A Framework for Personalized Location Privacy (CCF-A)
个性化位置隐私框架 (CCF-A)
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:7.9
- 作者:
Ben Niu;Qinghua Li;Hanyi Wang;Guohong Cao;Fenghua Li;Hui Li - 通讯作者:
Hui Li
Compromise-resilient anti-jamming communication in wireless sensor networks
- DOI:
10.1007/s11276-011-0361-8 - 发表时间:
2011-06-18 - 期刊:
- 影响因子:2.100
- 作者:
Xuan Jiang;Wenhui Hu;Sencun Zhu;Guohong Cao - 通讯作者:
Guohong Cao
One‐year status of hepatic venous pressure gradient measurement from 85 hospitals in China
国内85家医院一年肝静脉压力梯度测量现状
- DOI:
10.1002/poh2.68 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Jitao Wang;Ting Cui;Linpeng Zhang;Zhiping Yan;Lei Li;Jinjun Chen;Junhui Sun;Hua Xiang;He Zhu;Hao Wu;Jiancuo Gengzang;Feng Zhang;Wei Wu;Guohong Cao;Wuhua Guo;Haibin Shi;Hui Xue;Guangjun Huang;Qiang Yu;M. Niu;Huiling Xiang;Derun Kong;Wei Gou;Xuefeng Luo;Fuliang He;M. Yuan;Wei Liu;Yong Wang;Hongjie Hu;Xiaoliang Zhu;Tao Yu;Qinxue Sun;Wei Qu;Ting Lu;Deqiang Ma;Li Zhang;Jun Ma;Jun Yang;Ketao Mu;Xiaoliang Zhu;Kai Xiong;Huiguo Ding;Shengjuan Yao;Mingsheng Huang;Fang Wang;Zexin Wang;Yong Huang;Jianan Li;Hongfeng Yi;Birun Huang;Zhongwei Zhao;Duiping Feng;Yanming Lei;Changlong Hou;Wen;Shirong Liu;Gao;Kangshun Zhu;Fan Wu;Xiaogang Hu;Wenfeng Zhang;Shao;Zhouchao Hu;P. Pang;S. Zhuang;Weidong Wang;Q. Zhu;Kunpeng Zhang;Chengyu Liu;Dongliang Li;Chao Ma;Hong Jiang;Xingong Zhao;W. Ren;Zhiwei Wang;Lei Yu;Fuhuang Lin;Chaoguang Yan;Feng Wang;Lei Yu;Hui Huan;Wenyong Shen;Shaofei He;Chengda Zhang;Jin Bao;Jiangtao Liu;Jun Wu;Jianbo Zhao;Jian Zhang;Xiaolong Qi - 通讯作者:
Xiaolong Qi
YTHDC1 phase separation drives the nuclear export of m6A-modified lncNONMMUT062668.2 through the transport complex SRSF3–ALYREF–XPO5 to aggravate pulmonary fibrosis
YTHDC1 相分离通过转运复合物 SRSF3–ALYREF–XPO5 驱动 m6A 修饰的 lncNONMMUT062668.2 的核输出以加重肺纤维化
- DOI:
10.1038/s41419-025-07608-x - 发表时间:
2025-04-12 - 期刊:
- 影响因子:9.600
- 作者:
Shengjun Chen;Yujie Wang;Jinjin Zhang;Bo Liu;Weili Liu;Guohong Cao;Rongrong Li;Hongbo Li;Nailiang Zhai;Xiaodong Song;Songzi Zhang;Changjun Lv - 通讯作者:
Changjun Lv
On Improving the Performance of Cache Invalidation in Mobile Environments
- DOI:
10.1023/a:1015463328335 - 发表时间:
2002-08-01 - 期刊:
- 影响因子:2.000
- 作者:
Guohong Cao - 通讯作者:
Guohong Cao
Guohong Cao的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Guohong Cao', 18)}}的其他基金
Collaborative Research: SHF: Small: Software Hardware Architecture Co-Design for Enabling True Virtual Reality on Mobile Devices
合作研究:SHF:小型:软件硬件架构协同设计,在移动设备上实现真正的虚拟现实
- 批准号:
2215043 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CSR: Small: Energy-Aware and QoE-Aware Video Streaming on Mobile Devices
CSR:小:移动设备上的能源感知和 QoE 感知视频流
- 批准号:
1815465 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: Collaborative Research: Network-Centric Mobile Cloud Computing
NeTS:小型:协作研究:以网络为中心的移动云计算
- 批准号:
1526425 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: Resource-Aware Crowdsourcing in Wireless Networks
NetS:小型:无线网络中的资源感知众包
- 批准号:
1421578 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: Resilient and Efficient Data Access in Cognitive Radio Networks
NeTS:小型:认知无线电网络中弹性且高效的数据访问
- 批准号:
1320278 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: Efficient Energy-Aware Web Browsing in Wireless Networks
NetS:小型:无线网络中的高效节能网页浏览
- 批准号:
1218597 - 财政年份:2012
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS:Small:Supporting Multi-Missions in Wireless Sensor Networks
NetS:小型:支持无线传感器网络中的多任务
- 批准号:
0916171 - 财政年份:2009
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS-WN: Collaborative Data Access in Wireless P2P Networks
NeTS-WN:无线 P2P 网络中的协作数据访问
- 批准号:
0721479 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
NeTS-NOSS: Controllable Node Mobility for Mission-Oriented Sensor Networks
NeTS-NOSS:面向任务的传感器网络的可控节点移动性
- 批准号:
0519460 - 财政年份:2005
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
ITR: Efficient Power-Aware Data Access in Pervasive Computing Environments
ITR:普适计算环境中的高效节能数据访问
- 批准号:
0219711 - 财政年份:2002
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
- 批准号:
10099896 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
- 批准号:
AH/X011747/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
- 批准号:
MR/Z503757/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
- 批准号:
BB/Y004426/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
- 批准号:
ST/Z000017/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
- 批准号:
2317251 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant