CNS Core: Small: Harnessing Weight Repetition for Efficient Deep Neural Network Inference on General-Purpose Platforms

CNS 核心:小型:利用权重重复在通用平台上进行高效深度神经网络推理

基本信息

项目摘要

Society is witnessing an explosion in the use of Deep Neural Networks (DNNs) across all facets of daily life including health, finances, entertainment and transportation. DNNs are used by performing DNN inference, which queries the DNN with an input (for example, an image) to get an answer (for example, a classification). Society relies on inference every day, where it is run on devices ranging from cloud servers to personal computers. The goal of this project is to develop new ways to make inference efficient (fast, low power) on these devices.The technical approach is to explore how a new phenomenon, called weight repetition, can be applied to general-purpose devices such as Central Processing Units (CPUs) and Graphical Processing Units (GPUs). The idea is, when a DNN weight is repeated, DNN inference operations can be simplified. The first project thrust will develop high-efficiency weight repetition-aware software kernels that can run on un-modified hardware. The second thrust will develop novel training techniques to co-design the DNN with the weight repetition-aware kernels. Finally, the third thrust will explore what point hardware modifications can be made to further improve efficiency in the first two thrusts.By proving weight repetition's effectiveness on general-purpose devices, this project will unlock innovation in software, algorithms and hardware. The project will also amplify the improvement possible from related, but orthogonal, techniques such as weight quantization and weight sparsity. To support the cross-stack approach, the project will train a new class of students and researchers who can work across high-performance software, hardware and DNN training algorithms to build co-designed Machine Learning stacks and, in the future, apply the lessons learned to other high-impact problems that require cross-layer solutions.The project will store all publications, code and data-sets on public-facing websites, hosted at the University of Illinois for at least 3 years after the end of the project. This information will be made available via commercial websites. Links to these websites will be mirrored at http://cwfletcher.net/weightrepetition.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
社会正在见证深度神经网络(DNN)在日常生活的各个方面的爆炸式使用,包括健康,财务,娱乐和交通。 DNN通过执行DNN推理来使用,DNN推理使用输入(例如,图像)查询DNN以获得答案(例如,分类)。 社会每天都依赖于推理,它在从云服务器到个人电脑的各种设备上运行。 该项目的目标是开发新的方法,使这些设备上的推理效率(快速,低功耗)。技术方法是探索如何将一种称为权重重复的新现象应用于通用设备,如中央处理器(CPU)和图形处理器(GPU)。 这个想法是,当DNN权重重复时,DNN推理操作可以简化。 第一个项目的重点是开发可以在未经修改的硬件上运行的高效权重重复感知软件内核。 第二个目标是开发新的训练技术,以协同设计DNN和权重重复感知内核。 最后,第三个重点将探索在前两个重点中,可以对硬件进行哪些改进以进一步提高效率。通过在通用设备上证明重量重复的有效性,该项目将开启软件、算法和硬件的创新。 该项目还将扩大相关但正交的技术(如权重量化和权重稀疏)的可能改进。 为了支持跨栈方法,该项目将培训一批新的学生和研究人员,他们可以跨高性能软件、硬件和DNN训练算法工作,以构建共同设计的机器学习栈,并在未来将学到的经验教训应用于其他需要跨层解决方案的高影响力问题。该项目将在面向公众的网站上存储所有出版物、代码和数据集,项目结束后,在伊利诺伊大学主持至少3年。 这些信息将通过商业网站提供。 这些网站的链接将反映在http://cwfletcher.net/weightrepetition.This奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Speculative Taint Tracking (STT): A Comprehensive Protection for Speculatively Accessed Data
  • DOI:
    10.1145/3352460.3358274
  • 发表时间:
    2019-10
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Jiyong Yu;Mengjia Yan;Artem Khyzha;Adam Morrison;J. Torrellas;Christopher W. Fletcher
  • 通讯作者:
    Jiyong Yu;Mengjia Yan;Artem Khyzha;Adam Morrison;J. Torrellas;Christopher W. Fletcher
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christopher Fletcher其他文献

Tobacco: Promotion and Smoking-Reply
烟草:促销和吸烟-回复
  • DOI:
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Difranza;J. W. Richards;P. Paulman;Nancy Wolf;Christopher Fletcher;Robert D. Jaffe
  • 通讯作者:
    Robert D. Jaffe
Beyond the Public Meeting: Building a Field-Based Participatory GIS for Land Use Planning in Monongalia County, West Virginia
公开会议之外:为西弗吉尼亚州莫农加利亚县的土地利用规划构建基于现场的参与式 GIS
  • DOI:
    10.4018/978-1-59140-845-1.ch003
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    Timothy L. Hawthorne;M. Dougherty;G. Elmes;Christopher Fletcher;B. McCusker;Marta Pinto;Daniel Weiner
  • 通讯作者:
    Daniel Weiner
Trade and Transport in Late Roman Syria
罗马晚期叙利亚的贸易和运输
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Christopher Fletcher
  • 通讯作者:
    Christopher Fletcher
Phase II study of venetoclax added to bendamustine and obinutuzumab in patients with high-risk follicular lymphoma as front-line therapy: PrE0403
维奈托克联合苯达莫司汀和奥比妥珠单抗作为高危滤泡性淋巴瘤一线治疗的 II 期研究:PrE0403
  • DOI:
    10.1038/s41408-025-01300-1
  • 发表时间:
    2025-05-12
  • 期刊:
  • 影响因子:
    11.600
  • 作者:
    Craig A. Portell;Opeyemi A. Jegede;Nina Wagner-Johnston;Grzegorz S. Nowakowski;Christopher Fletcher;Jonathon B. Cohen;Andrew M. Evens;Lori J. Rosenstein;Jeffrey W. Craig;Nishitha Reddy;Brad S. Kahl
  • 通讯作者:
    Brad S. Kahl
York: The Making of a City, 1068-1350 by Sarah Rees Jones (review)
约克:一座城市的形成,1068-1350 年莎拉·里斯·琼斯(Sarah Rees Jones)(评论)

Christopher Fletcher的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christopher Fletcher', 18)}}的其他基金

SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
  • 批准号:
    2425665
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: SaTC: CORE: Medium: Systematic Detection Of and Defenses Against Next-Generation Microarchitectural Attacks
协作研究:SaTC:核心:中:下一代微架构攻击的系统检测和防御
  • 批准号:
    2154183
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
  • 批准号:
    1954521
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Fortifying Leaky Hardware Interfaces with Distinguishability Set Architectures
职业:通过可区分性集架构强化泄漏硬件接口
  • 批准号:
    1942888
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Small: Collaborative: Oblivious ISAs for Secure and Efficient Enclave Programming
SaTC:核心:小型:协作:用于安全高效 Enclave 编程的不经意的 ISA
  • 批准号:
    1816226
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

胆固醇羟化酶CH25H非酶活依赖性促进乙型肝炎病毒蛋白Core及Pre-core降解的分子机制研究
  • 批准号:
    82371765
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
锕系元素5f-in-core的GTH赝势和基组的开发
  • 批准号:
    22303037
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于合成致死策略搭建Core-matched前药共组装体克服肿瘤耐药的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
鼠伤寒沙门氏菌LPS core经由CD209/SphK1促进树突状细胞迁移加重炎症性肠病的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肌营养不良蛋白聚糖Core M3型甘露糖肽的精确制备及功能探索
  • 批准号:
    92053110
  • 批准年份:
    2020
  • 资助金额:
    70.0 万元
  • 项目类别:
    重大研究计划
Core-1-O型聚糖黏蛋白缺陷诱导胃炎发生并介导慢性胃炎向胃癌转化的分子机制研究
  • 批准号:
    81902805
  • 批准年份:
    2019
  • 资助金额:
    20.5 万元
  • 项目类别:
    青年科学基金项目
原始地球增生晚期的Core-merging大碰撞事件:地核增生、核幔平衡与核幔边界结构的新认识
  • 批准号:
    41973063
  • 批准年份:
    2019
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
CORDEX-CORE区域气候模拟与预估研讨会
  • 批准号:
    41981240365
  • 批准年份:
    2019
  • 资助金额:
    1.5 万元
  • 项目类别:
    国际(地区)合作与交流项目
RBM38通过协助Pol-ε结合、招募core调控HBV复制
  • 批准号:
    31900138
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
  • 批准号:
    2322919
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
  • 批准号:
    2343469
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Intelligent Fault Injection to Expose and Reproduce Production-Grade Bugs in Cloud Systems
CNS 核心:小型:智能故障注入以暴露和重现云系统中的生产级错误
  • 批准号:
    2317698
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Repurposing Smartphones to Minimize Carbon
CNS 核心:小型:重新利用智能手机以最大限度地减少碳排放
  • 批准号:
    2233894
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
  • 批准号:
    2230945
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CNS Core: Small: Towards Scalable and Al-based Solutions for Beyond-5G Radio Access Networks
合作研究:NSF-AoF:CNS 核心:小型:面向超 5G 无线接入网络的可扩展和基于人工智能的解决方案
  • 批准号:
    2225578
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Toward Opportunistic, Fast, and Robust In-Cache AI Acceleration at the Edge
CNS 核心:小型:在边缘实现机会主义、快速且稳健的缓存内 AI 加速
  • 批准号:
    2228028
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: SmartSight: an AI-Based Computing Platform to Assist Blind and Visually Impaired People
合作研究:中枢神经系统核心:小型:SmartSight:基于人工智能的计算平台,帮助盲人和视障人士
  • 批准号:
    2418188
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Redesigning I/O Across Heterogeneous Systems
CNS 核心:小型:跨异构系统重新设计 I/O
  • 批准号:
    2231724
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Creating An Extensible Internet Through Interposition
合作研究:CNS核心:小:通过介入创建可扩展的互联网
  • 批准号:
    2242503
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了