III: Small: Task-aware Materialization for Fast Data Analytics

III:小型:用于快速数据分析的任务感知物化

基本信息

  • 批准号:
    1910014
  • 负责人:
  • 金额:
    $ 42.9万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-01 至 2023-08-31
  • 项目状态:
    已结题

项目摘要

The data-to-knowledge pipeline is central to our data-driven world. It consumes data in raw format and then cleans, transforms, integrates, stores, processes, and analyzes the data to obtain knowledge in a usable format. Data analytics pipelines are complex and their workflows typically consist of several simpler tasks chained together. To speed up such pipelines, a ubiquitous optimization technique is to materialize the intermediate result of a task, so that downstream tasks can access the intermediate data as efficiently as possible. Existing materialization techniques suffer from several drawbacks, including prohibitively large cost in terms of storage and preprocessing time. To address these drawbacks, this proposal will develop smart materialization algorithms that can significantly accelerate the performance of data analytics applications. As a result, it will enable data scientists to obtain actionable insights faster and will impact research in areas such as biology, economics, sociology and the medical sciences. The goal of this project is to design, implement and evaluate materialization techniques using three novel ideas: task-aware materialization; fine-grained decisions on what and how to materialize; and multiple design points that can trade off space for time to achieve optimal performance of data analytics pipelines. The project will also explore how to design data structures for materialization that are adaptive to changes in the data and the downstream workload. From a theoretical viewpoint, the proposed research will aim to obtain theoretical guarantees on the tradeoff between space and time for materialization for different tasks. From a practical viewpoint, it will result in implementing and evaluating the developed algorithms on real-world data analytics applications, including visualization through lineage tracking, statistical inference, pattern retrieval in graphs and social network analysis.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据到知识的管道是我们这个数据驱动的世界的核心。它使用原始格式的数据,然后对数据进行清理、转换、集成、存储、处理和分析,以获得可用格式的知识。数据分析管道是复杂的,它们的工作流通常由几个简单的任务链接在一起组成。为了加快这种管道的速度,一种无处不在的优化技术是将任务的中间结果具体化,以便下游任务能够尽可能高效地访问中间数据。现有的物化技术有几个缺点,包括在存储和预处理时间方面的过高成本。为了解决这些缺点,本提案将开发智能物化算法,可以显着加快数据分析应用程序的性能。因此,它将使数据科学家能够更快地获得可操作的见解,并将影响生物学、经济学、社会学和医学等领域的研究。这个项目的目标是设计,实施和评估物化技术使用三个新颖的想法:任务感知物化;关于实现什么和如何实现的细粒度决策;多个设计点可以权衡空间和时间,以实现数据分析管道的最佳性能。该项目还将探索如何设计能够适应数据变化和下游工作负载的数据结构。从理论的角度来看,本文的研究旨在为不同任务的物化在空间和时间之间的权衡获得理论保证。从实际的角度来看,它将导致在现实世界的数据分析应用中实现和评估开发的算法,包括通过血统跟踪的可视化、统计推断、图形模式检索和社会网络分析。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Space-Time Tradeoffs for Conjunctive Queries with Access Patterns
具有访问模式的联合查询的时空权衡
Fast Join Project Query Evaluation using Matrix Multiplication
General Space-Time Tradeoffs via Relational Queries
通过关系查询进行一般时空权衡
Ranked Enumeration of Join Queries with Projections
  • DOI:
    10.14778/3510397.3510401
  • 发表时间:
    2022-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shaleen Deep;Xiao Hu;Paraschos Koutris
  • 通讯作者:
    Shaleen Deep;Xiao Hu;Paraschos Koutris
Enumeration Algorithms for Conjunctive Queries with Projection
带投影的联合查询的枚举算法
  • DOI:
    10.4230/lipics.icdt.2021.14
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Deep, Shaleen;Hu, Xiao;Koutris, Paraschos
  • 通讯作者:
    Koutris, Paraschos
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Paraschos Koutris其他文献

Certifiable Robustness for Nearest Neighbor Classifiers
最近邻分类器的可证明鲁棒性
  • DOI:
    10.4230/lipics.icdt.2022.6
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Austen Z. Fan;Paraschos Koutris
  • 通讯作者:
    Paraschos Koutris
Demonstration of the Myria big data management service
Myria大数据管理服务演示
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Halperin;Victor Teixeira de Almeida;L. Choo;Shumo Chu;Paraschos Koutris;Dominik Moritz;Jennifer Ortiz;Vaspol Ruamviboonsuk;Jingjing Wang;Andrew Whitaker;Shengliang Xu;M. Balazinska;Bill Howe;Dan Suciu
  • 通讯作者:
    Dan Suciu
Automated tuning of query degree of parallelism via machine learning
通过机器学习自动调整查询并行度
Comprehensive and Efficient Workload Compression
全面高效的工作负载压缩
  • DOI:
    10.5555/3430915.3442439
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shaleen Deep;Anja Gruenheid;Paraschos Koutris;J. Naughton;Stratis Viglas
  • 通讯作者:
    Stratis Viglas
Consistent Query Answering for Primary Keys and Conjunctive Queries with Negated Atoms
主键和带有否定原子的联合查询的一致查询应答

Paraschos Koutris的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Paraschos Koutris', 18)}}的其他基金

CRII: III: Partition-aware Parallel Query Processing
CRII:III:分区感知并行查询处理
  • 批准号:
    1850348
  • 财政年份:
    2019
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
SHF: Small: A General-purpose Parallel and Heterogeneous Task Graph Computing System for VLSI CAD
SHF:小型:用于 VLSI CAD 的通用并行异构任务图计算系统
  • 批准号:
    2349141
  • 财政年份:
    2023
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
RI: Small: Visual How: Task Understanding and Description in the Real World
RI:小:视觉方式:现实世界中的任务理解和描述
  • 批准号:
    2143197
  • 财政年份:
    2022
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
Task A74: APP-High Throughput Evaluation of Therapeutics in Small Animal Models of Coronavirus Infection
任务 A74:APP-冠状病毒感染小动物模型治疗的高通量评估
  • 批准号:
    10788023
  • 财政年份:
    2022
  • 资助金额:
    $ 42.9万
  • 项目类别:
Task A74: APP-High Throughput Evaluation of Therapeutics in Small Animal Models of Coronavirus Infection
任务 A74:APP-冠状病毒感染小动物模型治疗的高通量评估
  • 批准号:
    10683683
  • 财政年份:
    2022
  • 资助金额:
    $ 42.9万
  • 项目类别:
Collaborative Research: NeTS: Small: Reliable Task Offloading in Mobile Autonomous Systems Through Semantic MU-MIMO Control
合作研究:NeTS:小型:通过语义 MU-MIMO 控制实现移动自治系统中的可靠任务卸载
  • 批准号:
    2134973
  • 财政年份:
    2021
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
Task A53: High Throughput Evaluation of COVID-19 Therapeutics in Small Animal Models
任务 A53:小动物模型中 COVID-19 疗法的高通量评估
  • 批准号:
    10475975
  • 财政年份:
    2021
  • 资助金额:
    $ 42.9万
  • 项目类别:
Task A51: Small Animal Models for Biodefense Viruses
任务 A51:生物防御病毒的小动物模型
  • 批准号:
    10830230
  • 财政年份:
    2021
  • 资助金额:
    $ 42.9万
  • 项目类别:
Collaborative Research: NeTS: Small: Reliable Task Offloading in Mobile Autonomous Systems Through Semantic MU-MIMO Control
合作研究:NeTS:小型:通过语义 MU-MIMO 控制实现移动自治系统中的可靠任务卸载
  • 批准号:
    2134567
  • 财政年份:
    2021
  • 资助金额:
    $ 42.9万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了