SHF: Small: Sparsity-Aware Hardware Accelerators for Natural Language Processing with Transformers
SHF:小型:使用 Transformer 进行自然语言处理的稀疏感知硬件加速器
基本信息
- 批准号:2007362
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Natural Language Processing (NLP) enables people to interact with machines in the same manner as with each other. More importantly, it provides machines with the ability to access the information and knowledge that are readily available in books, articles, and various unstructured documents. Because the quality and usability of NLP-powered services depends primarily on the quantity of text the system is able to process, the computational demands of advanced NLP applications far exceed the capabilities of general-purpose computers and continue to grow. This project aims to greatly improve the performance of NLP applications based on transformers, a class of neural networks used in most state-of-the-art NLP technology. This project will significantly improve performance and efficiency for NLP applications, enabling their widespread deployment in emerging datacenters and thus enhancing the quality of human interactions with machines and each other.This project advances the state of the art of accelerators (hardware and compilers) for natural language processing, focusing primarily on sparsity-aware inference in large multi-layered self-attention based models, which have so far received limited attention from the architecture community. The project also advances NLP knowledge of sparse attention functions, studies design techniques that allow for repurposing pre-trained models to run faster, and improves the effectiveness in applications which diverge from its training setting. The investigation focuses on the key observation that the massive growth in computational complexity can be mitigated by dynamically identifying inherent sparsity and ineffectual computation in models, refitting the model to induce sparsity with the goal of either approximating or entirely avoiding parts of the computation that have limited impact on the model results. This investigation will demonstrate the performance improvement obtained by these techniques, leveraging sparsity and dynamic predictions within a novel sparsity-aware hardware acceleration framework, implemented on a field-programmable gate array (FPGA).This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
自然语言处理(NLP)使人们能够以与彼此相同的方式与机器交互。更重要的是,它为机器提供了访问书籍、文章和各种非结构化文档中随时可用的信息和知识的能力。由于NLP支持的服务的质量和可用性主要取决于系统能够处理的文本数量,因此高级NLP应用程序的计算需求远远超过通用计算机的能力,而且还在继续增长。该项目旨在极大地提高基于变压器的NLP应用程序的性能,变压器是大多数最先进的NLP技术中使用的一类神经网络。这个项目将显著提高自然语言处理应用程序的性能和效率,使它们能够在新兴的数据中心得到广泛的部署,从而提高人类与机器和彼此之间交互的质量。这个项目促进了自然语言处理加速器(硬件和编译器)的发展,主要集中在基于大型多层自我注意的模型中的稀疏感知推理,到目前为止,建筑界对这些模型的关注有限。该项目还提高了稀疏注意函数的NLP知识,研究了允许重新调整预先训练的模型以更快运行的设计技术,并提高了与其训练设置背道而驰的应用程序的有效性。研究的重点是,通过动态识别模型中固有的稀疏性和无效计算,重新调整模型以引入稀疏性,目标是近似或完全避免对模型结果影响有限的部分计算,可以缓解计算复杂性的大规模增长。这项调查将展示这些技术在现场可编程门阵列(FPGA)上实施的新型稀疏性感知硬件加速框架内利用稀疏性和动态预测获得的性能改进。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
IrEne: Interpretable Energy Prediction for Transformers
- DOI:10.18653/v1/2021.acl-long.167
- 发表时间:2021-06
- 期刊:
- 影响因子:0
- 作者:Qingqing Cao;Yash Kumar Lal;H. Trivedi;A. Balasubramanian;Niranjan Balasubramanian
- 通讯作者:Qingqing Cao;Yash Kumar Lal;H. Trivedi;A. Balasubramanian;Niranjan Balasubramanian
On the Distribution, Sparsity, and Inference-time Quantization of Attention Values in Transformers
- DOI:10.18653/v1/2021.findings-acl.363
- 发表时间:2021-06
- 期刊:
- 影响因子:0
- 作者:Tianchu Ji;Shraddhan Jain;M. Ferdman;Peter Milder;H. A. Schwartz;Niranjan Balasubramanian
- 通讯作者:Tianchu Ji;Shraddhan Jain;M. Ferdman;Peter Milder;H. A. Schwartz;Niranjan Balasubramanian
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Peter Milder其他文献
"Smart" design space sampling to predict Pareto-optimal solutions
“智能”设计空间采样来预测帕累托最优解决方案
- DOI:
10.1145/2248418.2248436 - 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
M. Zuluaga;Andreas Krause;Peter Milder;Markus Püschel - 通讯作者:
Markus Püschel
Domain-specific library generation for parallel software and hardware platforms
用于并行软件和硬件平台的特定领域库生成
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
F. Franchetti;Y. Voronenko;Peter Milder;S. Chellappa;Marek R. Telgarsky;Hao Shen;P. D'Alberto;Frédéric de Mesmay;J. Hoe;José M. F. Moura;Markus Püschel - 通讯作者:
Markus Püschel
Wireless Multicast Rate Control Adaptive to Application Goodput and Loss Requirements
适应应用吞吐量和丢失要求的无线组播速率控制
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Mohammed Elbadry;Fan Ye;Peter Milder - 通讯作者:
Peter Milder
Generation and transmission of 85.4 Gb/s real-time 16QAM coherent optical OFDM signals over 400 km SSMF with preamble-less reception.
在 400 km SSMF 上生成和传输 85.4 Gb/s 实时 16QAM 相干光 OFDM 信号,并具有无前导码接收功能。
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:3.8
- 作者:
R. Bouziane;R. Schmogrow;D. Hillerkuss;Peter Milder;C. Koos;W. Freude;J. Leuthold;P. Bayvel;R. Killey - 通讯作者:
R. Killey
Design studies for ASIC implementations of 28 GS/s optical QPSK- and 16-QAM-OFDM transceivers.
28 GS/s 光学 QPSK 和 16-QAM-OFDM 收发器的 ASIC 实现的设计研究。
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:3.8
- 作者:
R. Bouziane;Peter Milder;R. Koutsoyannis;Y. Benlachtar;J. Hoe;Markus Püschel;M. Glick;R. Killey - 通讯作者:
R. Killey
Peter Milder的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
SHF: Small: Domain-Specific FPGAs to Accelerate Unrolled DNNs with Fine-Grained Unstructured Sparsity and Mixed Precision
SHF:小型:特定领域 FPGA 加速具有细粒度非结构化稀疏性和混合精度的展开 DNN
- 批准号:
2303626 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Sparsity in Local Computation
AF:小:局部计算的稀疏性
- 批准号:
2006664 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: A Systematic Approach to Adversarial Machine Learning: Sparsity-based Defenses and Locally Linear Attacks
CIF:小型:对抗性机器学习的系统方法:基于稀疏性的防御和局部线性攻击
- 批准号:
1909320 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Symbolic Computation with Certificates, Sparsity and Error Correction
AF:小:带有证书、稀疏性和纠错的符号计算
- 批准号:
1717100 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Sparsity in Quadratic Optimization through Low-Rank Approximations
CIF:小:通过低阶近似实现二次优化的稀疏性
- 批准号:
1422549 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Symbolic computation with sparsity, error checking and error correction
AF:小:具有稀疏性、错误检查和纠错的符号计算
- 批准号:
1421128 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Sparsity and Scarcity in High-Dimensional Point Processes
CIF:小:高维点过程中的稀疏性和稀缺性
- 批准号:
1418976 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Sparsity and Scarcity in High-Dimensional Point Processes
CIF:小:高维点过程中的稀疏性和稀缺性
- 批准号:
1319927 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Beyond Sparsity - Exploiting Saliency in Compressive and Adaptive Sensing
CIF:小:超越稀疏性 - 利用压缩和自适应传感中的显着性
- 批准号:
1217751 - 财政年份:2012
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Computationally Efficient Analytic Reconstructions via Embeddings and Sparsity for Non-Linear Dynamic Imaging Problems
CIF:小:通过嵌入和稀疏性对非线性动态成像问题进行计算高效的分析重建
- 批准号:
1218805 - 财政年份:2012
- 资助金额:
$ 50万 - 项目类别:
Standard Grant














{{item.name}}会员




