SHF: Small: Domain-Specific FPGAs to Accelerate Unrolled DNNs with Fine-Grained Unstructured Sparsity and Mixed Precision

SHF:小型:特定领域 FPGA 加速具有细粒度非结构化稀疏性和混合精度的展开 DNN

基本信息

  • 批准号:
    2303626
  • 负责人:
  • 金额:
    $ 59.84万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-05-15 至 2026-04-30
  • 项目状态:
    未结题

项目摘要

Artificial intelligence (AI) has become an essential part of our daily lives, revolutionizing various industries and transforming the way we interact with technology. One of the key factors behind AI's remarkable progress is the efficiency of deep neural networks (DNNs). These complex systems, akin to the human brain, excel at processing vast amounts of data, enabling them to learn and make informed decisions. Compared to traditional computer programs, DNNs have shown superior performance in tasks such as image recognition, natural language processing, and decision-making. Unfortunately, this improved performance requires substantially more energy and computational resources. This not only increases their running costs but also limits their deployment in resource-constrained environments like battery-powered devices, hindering the broader adoption of AI systems. Interestingly, DNN computations often involve many redundant operations, termed generally as "sparsity." This project aims to develop specialized computer chips and software programs that exploit abundant fine-grained sparsity to enhance AI performance while reducing energy consumption and computational costs. Outcomes of this research award will be integrated into educational curricula and research mentorship plans at the graduate and undergraduate level, to educate the next generation of computer engineers on the importance of hardware/software codesign for deep learning. In addition, an outreach activity is planned to increase the participation of women in the hardware development for AI.This project focuses on the hardware acceleration of DNNs with fine-grained unstructured sparsity and mixed precision, two forms of redundancy that have yet to be exploited efficiently by existing computer chips. The research team focuses on optimizing unrolled DNN circuits on programmable hardware, starting with the current general-purpose hardware fabric of field-programmable gate arrays (FPGAs) and progressing towards DNN-optimized fabrics. A systematic benchmark-driven approach is used to specialize FPGA components for the implementation of unrolled DNN circuits. Furthermore, the team investigates more significant changes to the FPGA fabric, such as time-multiplexing and in-memory computing, to increase logic capacity and enable the deployment of larger DNNs. To extract maximum efficiency, DNN sparsification algorithms are codesigned, including pruning, quantization, and parameter sharing. This award is expected to result in new bit-programmable hardware architectures, DNN sparsification algorithms, and a research framework to synergistically codesign sparse DNNs and hardware.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人工智能(AI)已成为我们日常生活中必不可少的一部分,它彻底改变了各个行业,并改变了我们与技术互动的方式。人工智能取得显著进步的关键因素之一是深度神经网络(DNN)的效率。这些复杂的系统,类似于人类的大脑,擅长处理大量的数据,使他们能够学习和做出明智的决定。与传统的计算机程序相比,DNN在图像识别、自然语言处理和决策等任务中表现出了上级性能。不幸的是,这种改进的性能需要更多的能量和计算资源。这不仅增加了它们的运行成本,还限制了它们在电池供电设备等资源受限环境中的部署,阻碍了人工智能系统的广泛采用。有趣的是,DNN计算通常涉及许多冗余操作,通常称为“稀疏性”。“该项目旨在开发专门的计算机芯片和软件程序,利用丰富的细粒度稀疏性来提高AI性能,同时降低能耗和计算成本。该研究奖的成果将被整合到研究生和本科生的教育课程和研究导师计划中,以教育下一代计算机工程师关于硬件/软件协同设计对深度学习的重要性。此外,为了提高女性在人工智能硬件开发中的参与度,还计划开展一项外展活动。该项目的重点是对具有细粒度非结构化稀疏性和混合精度的DNN进行硬件加速,这两种冗余形式尚未被现有的计算机芯片有效利用。研究团队专注于优化可编程硬件上展开的DNN电路,从当前的现场可编程门阵列(FPGA)通用硬件结构开始,并朝着DNN优化结构发展。一个系统的基准驱动的方法是用来专门的FPGA组件的实施展开DNN电路。此外,该团队还研究了FPGA结构的更重大变化,例如时间复用和内存计算,以增加逻辑容量并实现更大DNN的部署。为了提取最大效率,DNN稀疏化算法被共同设计,包括修剪、量化和参数共享。该奖项预计将产生新的位可编程硬件架构,DNN稀疏算法,以及协同协同设计稀疏DNN和硬件的研究框架。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BRAMAC: Compute-in-BRAM Architectures for Multiply-Accumulate on FPGAs
BRAMAC:用于 FPGA 上乘法累加的 BRAM 计算架构
M4BRAM: Mixed-Precision Matrix-Matrix Multiplication in FPGA Block RAMs
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mohamed Abdelfattah其他文献

Computed tomography vs. cinefluoroscopy for the assessment of mechanical prosthetic valve leaflet motion
  • DOI:
    10.1007/s00380-022-02193-x
  • 发表时间:
    2022-10-27
  • 期刊:
  • 影响因子:
    1.500
  • 作者:
    Mohammad Abdelghani;Mohamed Abdelfattah;Ahmed Mohamed Diab;Hamada Elsheikh;Mohy E. Mansour Elabbady
  • 通讯作者:
    Mohy E. Mansour Elabbady
Investigation and monitoring of rotational landslides in El Mokkattam plateau Egypt, using integrated geological and geophysical techniques
  • DOI:
    10.1016/j.heliyon.2024.e36545
  • 发表时间:
    2024-09-15
  • 期刊:
  • 影响因子:
  • 作者:
    Mohamed A. Gamal;Mohamed Abdelfattah;George Maher
  • 通讯作者:
    George Maher
Exploring the Limits of Semantic Image Compression at Micro-bits per Pixel
探索每像素微比特语义图像压缩的极限
  • DOI:
    10.48550/arxiv.2402.13536
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jordan Dotzel;Bahaa Kotb;James Dotzel;Mohamed Abdelfattah;Zhiru Zhang
  • 通讯作者:
    Zhiru Zhang
Monitoring coastal changes in Port Said, Egypt using multi-temporal satellite imagery and GIS-DSAS
  • DOI:
    10.1007/s40808-024-02266-y
  • 发表时间:
    2025-01-04
  • 期刊:
  • 影响因子:
    2.900
  • 作者:
    Hany F. Abd-Elhamid;Mohamed Abdelfattah;Martina Zeleňáková;Abd Elnaby Kabeel;Jacek Barańczuk;Salem S. Gharbia;Mohamed Mahdy
  • 通讯作者:
    Mohamed Mahdy
Comparative Study between Erector Spinae Plane Block versus Intravenous Morphine as Postoperative Analgesia after Spine Surgeries
竖脊肌平面阻滞与静脉吗啡用于脊柱术后镇痛的比较研究
  • DOI:
    10.21608/ejhm.2024.348925
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Khaled Mohamed;Hamza Hassan;Abo Alam;Mahmoud Mohamed Abo;Elhamd Abd;Elrahman;Khaled Abdelfattah;Mohamed Abdelfattah;Mohamed Abo Elhamd;Abd Elrahman
  • 通讯作者:
    Abd Elrahman

Mohamed Abdelfattah的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mohamed Abdelfattah', 18)}}的其他基金

CAREER: Efficient Large Language Model Inference Through Codesign: Adaptable Software Partitioning and FPGA-based Distributed Hardware
职业:通过协同设计进行高效的大型语言模型推理:适应性软件分区和基于 FPGA 的分布式硬件
  • 批准号:
    2339084
  • 财政年份:
    2024
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

SaTC: CORE: Small: Systematic Threat Characterization and Prevention in Open-Domain Dialog Systems
SaTC:核心:小型:开放域对话系统中的系统威胁特征描述和预防
  • 批准号:
    2231002
  • 财政年份:
    2023
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Mitigating Threats of Physical-Domain Signal Injections on Security, Reliability, and Safety of Sensing and Control Systems
SaTC:核心:小型:减轻物理域信号注入对传感和控制系统的安全性、可靠性和安全性的威胁
  • 批准号:
    2231682
  • 财政年份:
    2023
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Continuing Grant
RI: Small: Multilingual Supervision for Object Detection under Geographic Domain and Concept Shifts
RI:小型:地理领域和概念转变下目标检测的多语言监督
  • 批准号:
    2329992
  • 财政年份:
    2023
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Towards Deceptive and Domain-Specific Cyber-Physical Honeypots
SaTC:核心:小型:走向欺骗性和特定领域的网络物理蜜罐
  • 批准号:
    2231651
  • 财政年份:
    2023
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Standard Grant
Small protein-domain affinity reagents and D-proteins
小蛋白结构域亲和试剂和 D 蛋白
  • 批准号:
    RGPIN-2017-06195
  • 财政年份:
    2022
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Discovery Grants Program - Individual
Small protein-domain affinity reagents and D-proteins
小蛋白结构域亲和试剂和 D 蛋白
  • 批准号:
    RGPIN-2017-06195
  • 财政年份:
    2021
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Discovery Grants Program - Individual
Small protein-domain affinity reagents and D-proteins
小蛋白结构域亲和试剂和 D 蛋白
  • 批准号:
    RGPIN-2017-06195
  • 财政年份:
    2020
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Discovery Grants Program - Individual
Discovery of small molecules that specifically target the transmembrane C99 domain of the Amyloid Precursor Protein.
发现特异性靶向淀粉样前体蛋白跨膜 C99 结构域的小分子。
  • 批准号:
    10066062
  • 财政年份:
    2020
  • 资助金额:
    $ 59.84万
  • 项目类别:
III: Small: Go Beyond Short-term Dependency and Homogeneity: A General-Purpose Transformer Recipe for Multi-Domain Heterogeneous Sequential Data Analysis
III:小:超越短期依赖性和同质性:用于多域异构顺序数据分析的通用 Transformer 配方
  • 批准号:
    2008334
  • 财政年份:
    2020
  • 资助金额:
    $ 59.84万
  • 项目类别:
    Continuing Grant
Discovery of Small Molecule Ligands for PHD1 Reader Domain of Histone Demethylase KDM5A
组蛋白去甲基化酶 KDM5A 的 PHD1 阅读器结构域小分子配体的发现
  • 批准号:
    10183207
  • 财政年份:
    2020
  • 资助金额:
    $ 59.84万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了