CSR: Small: Scalable Fine-Grain Lineage for Debugging Data-Intensive Workflows

CSR:小型:用于调试数据密集型工作流程的可扩展细粒度谱系

基本信息

  • 批准号:
    1219220
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-09-01 至 2018-03-31
  • 项目状态:
    已结题

项目摘要

This project addresses the next major impediment to the continued adoptionof "big-data" analytics---the management of their life cycle, whichincludes debugging, tuning, and auditing. Today, data-intensive analyticsare improving operations across multiple industries, translating terabytesof raw data into useful data analysis. Taking advantage of big data willbe necessary to sustain competitive advantages for areas ranging from powergeneration, to retail, oil exploration, manufacturing, various scientificdisciplines, and national security. However, the extreme scalability ofthese data processing architectures hides inefficiencies and obfuscatesperformance analysis, creating both obvious and hidden costs to theiradoption. Tuning and debugging large data-intensive workflows is currentlya black art that mostly consists of tedious manual analysis.The research seeks to dramatically alter how data scientists design anddebug their analytics to sidestep this authoring and deployment bottleneck.In particular, the PI's are developing scalable, efficient architecturesfor capturing fine-grain data lineage, information that tracks the use ofdata through the analytic pipeline, from a range of data-intensive scalablecomputing (DISC) systems. Such lineage serves as a basis for discoveringinefficiencies and suggesting optimizations via step-wise debugging, faulttracing, anomaly detection, and lineage-driven data cleaning and datamining. The development and open-source release of such lineage-captureand analysis platforms promises to dramatically accelerate the adoption ofbig-data analytics.
该项目解决了继续采用“大数据”分析的下一个主要障碍——对其生命周期的管理,包括调试、调优和审计。如今,数据密集型分析正在改善多个行业的运营,将tb级的原始数据转化为有用的数据分析。从发电、零售、石油勘探、制造业、各种科学学科到国家安全等领域,利用大数据将是保持竞争优势的必要条件。然而,这些数据处理架构的极端可扩展性隐藏了效率低下和混淆性能分析,为采用它们创造了明显和隐藏的成本。目前,调优和调试大型数据密集型工作流是一项繁琐的手工分析工作。该研究试图极大地改变数据科学家如何设计和调试他们的分析,以避开这个创作和部署瓶颈。特别是,PI正在开发可扩展的高效架构,用于捕获细粒度数据谱系,通过分析管道跟踪数据使用的信息,来自一系列数据密集型可扩展计算(DISC)系统。这种沿袭可以作为发现效率低下和通过逐步调试、故障跟踪、异常检测以及沿袭驱动的数据清理和数据挖掘提出优化建议的基础。这种谱系捕获和分析平台的开发和开源发布有望极大地加速大数据分析的采用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alin Deutsch其他文献

A system for specification and verification of interactive, data-driven web applications
用于规范和验证交互式、数据驱动的 Web 应用程序的系统
A Spin-based Verifier for Artifact Systems
用于工件系统的基于自旋的验证器
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuliang Li;Alin Deutsch;V. Vianu
  • 通讯作者:
    V. Vianu
Privacy in GLAV Information Integration
GLAV 信息集成中的隐私
Querying XML Data
查询XML数据
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alin Deutsch;M. Fernández;D. Florescu;A. Halevy;D. Maier;Dan Suciu
  • 通讯作者:
    Dan Suciu
The next+ framework for logical xquery optimization
逻辑 xquery 优化的下一个框架
  • DOI:
    10.1016/b978-012088469-8.50018-8
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yu Xu;Alin Deutsch;Y. Papakonstantinou
  • 通讯作者:
    Y. Papakonstantinou

Alin Deutsch的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alin Deutsch', 18)}}的其他基金

III: Small: Personalized Inconsistency Resolution in Online Databases
III:小:在线数据库中的个性化不一致解决方案
  • 批准号:
    1117527
  • 财政年份:
    2011
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
DC: Large: Collaborative Research: ASTERIX: A Highly Scalable Parallel Platform for Semistructured Data Management and Analysis
DC:大型:协作研究:ASTERIX:用于半结构化数据管理和分析的高度可扩展并行平台
  • 批准号:
    0910820
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CAREER: XML Middleware for Privacy-Preserving Database Publishing
职业:用于隐私保护数据库发布的 XML 中间件
  • 批准号:
    0347968
  • 财政年份:
    2004
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: CONCERT: Designing Scalable Communication Runtimes with On-the-fly Compression for HPC and AI Applications on Heterogeneous Architectures
CSR:小型:CONCERT:为异构架构上的 HPC 和 AI 应用程序设计具有动态压缩的可扩展通信运行时
  • 批准号:
    2312927
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Toward a Scalable, Multi-Tenant, Edge-Cloud Infrastructure for Real-Time Computation
CSR:小:迈向可扩展、多租户、边缘云实时计算基础设施
  • 批准号:
    1815690
  • 财政年份:
    2018
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: SMALL: Virtualized Accelerators for Scalable, Composable Architectures
CSR:小型:用于可扩展、可组合架构的虚拟化加速器
  • 批准号:
    1718160
  • 财政年份:
    2017
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Scalable Fine-Grained Cloud Monitoring for Empowering IoT
CSR:小型:协作研究:支持物联网的可扩展细粒度云监控
  • 批准号:
    1615411
  • 财政年份:
    2016
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Scalable, heterogeneity-aware load balancing
CSR:小型:可扩展、异构感知负载平衡
  • 批准号:
    1617046
  • 财政年份:
    2016
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Design and Optimization of Scalable Concurrent Data Structures for Multi-Core Systems
CSR:小型:多核系统可扩展并发数据结构的设计和优化
  • 批准号:
    1619197
  • 财政年份:
    2016
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Scalable Fine-Grained Cloud Monitoring for Empowering IoT
CSR:小型:协作研究:支持物联网的可扩展细粒度云监控
  • 批准号:
    1616273
  • 财政年份:
    2016
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Scalable Transactional Replication: Theory, Protocols, and Middleware Systems
CSR:小型:可扩展事务复制:理论、协议和中间件系统
  • 批准号:
    1523558
  • 财政年份:
    2015
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Efficient and Scalable Systems Support for Mobile Group Formation, Inference, Recommendation and Classification
CSR:小型:高效且可扩展的系统支持移动组形成、推理、推荐和分类
  • 批准号:
    1528138
  • 财政年份:
    2015
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Scalable Coordination for Wide-Area Distributed Systems
CSR:小型:广域分布式系统的可扩展协调
  • 批准号:
    1527629
  • 财政年份:
    2015
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了