SHF: Small: Collaborative Research: Accelerated Data Transformation: A Software-Hardware Stack for Transducers

SHF:小型:协作研究:加速数据转换:传感器的软件硬件堆栈

基本信息

  • 批准号:
    1907863
  • 负责人:
  • 金额:
    $ 25.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Recent years have seen an explosive rise of "big data" and data-intensive computing. Many scientific and data analytics applications that operate on large data sets perform data transformation at their core. For example, many genomics applications translate DNA sequences into protein sequences and must perform this transformation on large volumes of data (petabytes) generated by DNA sequencers. Recent studies have shown that popular data analytics systems spend significant amount of time performing data transformation operations such as data compression, decompression, serialization, deserialization and error correction. While application-specific hardware accelerators can be useful, their narrow applicability can significantly limit their impact. On the other hand, accelerating a common computation at the core of many applications can have a broader impact, and benefit not only existing, but also future applications. This research targets the problem of general acceleration of data transformation. More specifically, to allow breadth of utility, the project aims to provide a software-hardware stack to accelerate the computational abstraction at the core of data transformation, namely, finite-state transducers. Given the societal importance of big data computing, a significant broader impact of this work is the uptake of research ideas and technology into the scientific base, and their resulting impact on a wide range of 'big data' applications for science, industry, and society. In addition, this project allows students to experience in first hand how abstract concepts such as finite-state transducers can be applied to practical problems, connecting elements of theory of computation, algorithm design and optimization, applications and systems architecture.The research investigates the transducers computational model and its efficient implementation with the goal of providing performance and energy-efficiency gains in data analytics systems all of which rely on data transformation. In particular, this work aims to reduce transducer theory to practical use by mapping transducer programs onto emerging data processing accelerators. To this end, this work targets the following issues. First, design a software stack to map transducers onto novel hardware accelerators. In particular, the investigators build on their previous work on the design and implementation of the Unstructured Data Processor, a novel hardware accelerator for data transformation shown to give high performance, but that at present lacks a high-level programming model. Accomplishing this goal requires investigating a set of platform-independent and platform-specific optimizations aimed to minimize the code size, minimize the memory utilization, and leverage the coarse- and fine-grained parallelism inherent in the computation. Second, improve and extend the underlying hardware accelerator based on the insights acquired in the design of the software stack. Third, extend the transducer model to express the full range of data transformations in popular data analytics systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,“大数据”和数据密集型计算呈爆炸式增长。 许多在大型数据集上运行的科学和数据分析应用程序在其核心执行数据转换。 例如,许多基因组学应用程序将DNA序列转换为蛋白质序列,并且必须对DNA测序仪生成的大量数据(PB)执行此转换。最近的研究表明,流行的数据分析系统花费大量的时间执行数据转换操作,例如数据压缩、解压缩、序列化、重复化和纠错。 虽然特定于应用程序的硬件加速器可能很有用,但其狭窄的适用性可能会大大限制其影响。另一方面,加速许多应用程序核心的通用计算可以产生更广泛的影响,不仅有利于现有的应用程序,而且有利于未来的应用程序。本研究针对数据转换的一般加速问题。更具体地说,为了允许广泛的实用性,该项目旨在提供一个软件-硬件堆栈,以加速数据转换核心的计算抽象,即有限状态传感器。考虑到大数据计算的社会重要性,这项工作的一个重要的更广泛的影响是将研究思想和技术纳入科学基础,以及它们对科学,工业和社会的广泛“大数据”应用的影响。此外,该项目还允许学生亲身体验如何将有限状态传感器等抽象概念应用于实际问题,连接计算理论,算法设计和优化的元素,应用程序和系统架构。该研究调查了传感器计算模型及其有效的实现,其目标是提供性能和能量-数据分析系统的效率提高,所有这些都依赖于数据转换。特别是,这项工作的目的是减少传感器理论的实际应用映射到新兴的数据处理加速器的传感器程序。为此,这项工作针对以下问题。首先,设计一个软件堆栈,将传感器映射到新的硬件加速器上。特别是,研究人员建立在他们以前的工作的设计和实现的非结构化数据处理器,一种新的硬件加速器的数据转换显示,提供高性能,但目前缺乏一个高层次的编程模型。实现这一目标需要研究一组独立于平台和特定于平台的优化,旨在最大限度地减少代码大小,最大限度地减少内存利用率,并利用计算中固有的粗粒度和细粒度并行性。第二,基于在软件栈设计中获得的见解,改进和扩展底层硬件加速器。第三,扩展传感器模型,以表达流行数据分析系统中的全方位数据转换。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A GPU-accelerated Data Transformation Framework Rooted in Pushdown Transducers
Data Transformation Acceleration using Deterministic Finite-State Transducers
使用确定性有限状态传感器加速数据转换
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michela Becchi其他文献

Editorial: Special Issue on Computing Frontiers

Michela Becchi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michela Becchi', 18)}}的其他基金

CSR: Small: Middleware Technologies for Multi-Accelerator Clusters
CSR:小型:多加速器集群的中间件技术
  • 批准号:
    1812727
  • 财政年份:
    2018
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: The Automata Programming Paradigm for Genomic Analysis
SHF:小型:协作研究:基因组分析的自动机编程范式
  • 批准号:
    1740583
  • 财政年份:
    2017
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
CAREER: Compiler and Runtime Support for Irregular Applications on Many-core Processors
职业:多核处理器上不规则应用程序的编译器和运行时支持
  • 批准号:
    1741683
  • 财政年份:
    2017
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Continuing Grant
SHF:Medium:Collaborative Research:A comprehensive methodology to pursue reproducible accuracy in ensemble scientific simulations on multi- and many-core platforms
SHF:中:协作研究:在多核和众核平台上追求集合科学模拟的可重复精度的综合方法
  • 批准号:
    1728850
  • 财政年份:
    2017
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
NeTS: Small: A Language-Based Approach to Deep Packet Inspection: from Theory to Practice
NeTS:Small:基于语言的深度数据包检测方法:从理论到实践
  • 批准号:
    1724934
  • 财政年份:
    2017
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
CAREER: Compiler and Runtime Support for Irregular Applications on Many-core Processors
职业:多核处理器上不规则应用程序的编译器和运行时支持
  • 批准号:
    1452454
  • 财政年份:
    2015
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Continuing Grant
SHF:Medium:Collaborative Research:A comprehensive methodology to pursue reproducible accuracy in ensemble scientific simulations on multi- and many-core platforms
SHF:中:协作研究:在多核和众核平台上追求集合科学模拟的可重复精度的综合方法
  • 批准号:
    1513603
  • 财政年份:
    2015
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: The Automata Programming Paradigm for Genomic Analysis
SHF:小型:协作研究:基因组分析的自动机编程范式
  • 批准号:
    1421765
  • 财政年份:
    2014
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
NeTS: Small: A Language-Based Approach to Deep Packet Inspection: from Theory to Practice
NeTS:Small:基于语言的深度数据包检测方法:从理论到实践
  • 批准号:
    1319748
  • 财政年份:
    2013
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
CSR: Small: Scheduling and Virtualization Technologies for Heterogeneous Clusters with Many-core Devices
CSR:小:多核设备异构集群的调度和虚拟化技术
  • 批准号:
    1216756
  • 财政年份:
    2012
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326895
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2334624
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
  • 批准号:
    2232720
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234921
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Reimagining Communication Bottlenecks in GNN Acceleration through Collaborative Locality Enhancement and Compression Co-Design
协作研究:SHF:小型:通过协作局部性增强和压缩协同设计重新想象 GNN 加速中的通信瓶颈
  • 批准号:
    2326494
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326894
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234920
  • 财政年份:
    2023
  • 资助金额:
    $ 25.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了