BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems

BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层

基本信息

  • 批准号:
    1251019
  • 负责人:
  • 金额:
    $ 68.54万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-15 至 2017-08-31
  • 项目状态:
    已结题

项目摘要

Big data today is stored in a distributed fashion across many different machines or data sources. This poses new algorithmic and system challenges to performing efficient analysis on the full data set. To address these difficulties, the PIs are building the MIDDLE (Mergeable and Interactive Distributed Data LayEr) Summarization System and deploying it on large real-world datasets. The MIDDLE system builds and maintains a special class of summaries that can be efficiently constructed and updated while still allowing fine-grained analysis on the heavy tail. Mergeable summaries can represent any data set with a guaranteed tradeoff between size and accuracy, and any two such summaries can be merged to create a new summary with the same size-accuracy tradeoff.Interactive summaries can be quickly adapted to a specified query range of data while maintaining the same size-accuracy tradeoffs relative to the data in that range. This allows accurate efficient analysis to zero-in on small subsets of big data.The MIDDLE system enables different big data users to develop a wide spectrum of efficient and scalable data analytic tasks through the use of data summaries. The MIDDLE system is being evaluated and refined with the aid of domain experts. Since the prospect of data-summary-based analytics becoming a part of standard techniques in processing big data is tantalizing, this research generates broader impacts on the nation's government agencies, research institutes, education system, and high-tech industries. Our broad impacts also extend to academia and community outreach, through the design and development big data curriculum and education, and the involvement of general public in understanding and using big data through concise summaries.
今天的大数据以分布式方式存储在许多不同的机器或数据源中。这给对整个数据集进行有效分析带来了新的算法和系统挑战。为了解决这些困难,PI正在构建中间(可合并和交互的分布式数据层)摘要系统,并将其部署在大型真实世界数据集上。中间系统构建并维护一类特殊的摘要,可以高效地构建和更新这些摘要,同时仍然允许对繁重的尾部进行细粒度分析。可合并摘要可以表示具有大小和精度折衷保证的任何数据集,并且可以将任何两个这样的摘要合并以创建具有相同大小精度折衷的新摘要。交互式摘要可以快速适应指定的数据查询范围,同时保持相对于该范围内的数据的相同大小精度折衷。这允许准确、高效地分析大数据的小子集。中间系统使不同的大数据用户能够通过使用数据摘要开发一系列高效且可扩展的数据分析任务。中间系统正在领域专家的帮助下进行评估和改进。由于基于数据摘要的分析成为处理大数据的标准技术的一部分的前景诱人,这项研究对国家政府机构、研究机构、教育系统和高科技行业产生了更广泛的影响。我们的广泛影响还延伸到学术界和社区外展,通过设计和开发大数据课程和教育,以及通过简洁的摘要让普通公众参与理解和使用大数据。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Feifei Li其他文献

Transport in Low Dimensional Strongly Correlated Electronic System
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Feifei Li
  • 通讯作者:
    Feifei Li
SeRF: Segment Graph for Range-Filtering Approximate Nearest Neighbor Search
SeRF:范围过滤近似最近邻搜索的线段图
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chaoji Zuo;Miao Qiao;Wenchao Zhou;Feifei Li;Dongjie Deng
  • 通讯作者:
    Dongjie Deng
A unusual two-dimensional azido-Cu(II) network with benzoate derivative as coligand exhibiting ferromagnetic order and slow magnetic relaxation
一种以苯甲酸酯衍生物为共配体的不寻常的二维叠氮基-Cu(II)网络,表现出铁磁有序和慢磁弛豫
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Xiangyu Liu;Peipei Cen;Feifei Li;Xiaohui Ma;Huiliang Zhou;Xiaoyan Chen;Weiming Song;Gang Xie;Sanping Chen
  • 通讯作者:
    Sanping Chen
A WSN Routing and Sleeping Algorithm in Agriculture Intermittent Data Collection
农业间歇数据采集中的无线传感器网络路由和休眠算法
  • DOI:
    10.4028/www.scientific.net/amm.513-517.606
  • 发表时间:
    2014-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Feng Huang;Chunjiang Zhao;Feifei Li;Huarui Wu
  • 通讯作者:
    Huarui Wu
Investigation of Two Kinds of Periodical Surface Structures Induced by Femtosecond Laser on the Surface of Titanium Plate
飞秒激光在钛板表面诱导两种周期性表面结构的研究
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Baoyuan Man;Xue Meng;Yanna Sun;Feifei Li
  • 通讯作者:
    Feifei Li

Feifei Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Feifei Li', 18)}}的其他基金

NSF DSSP Workshop: Data Science for Secure and Privacy-Aware Big Data Management and Mining
NSF DSSP 研讨会:用于安全和隐私意识大数据管理和挖掘的数据科学
  • 批准号:
    1647860
  • 财政年份:
    2016
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
TWC: Medium: Collaborative: Seal: Secure Engine for AnaLytics - From Secure Similarity Search to Secure Data Analytics
TWC:媒介:协作:Seal:AnaLytics 的安全引擎 - 从安全相似性搜索到安全数据分析
  • 批准号:
    1514520
  • 财政年份:
    2015
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
CIF21 DIBBs: STORM: Spatio-Temporal Online Reasoning and Management of Large Data
CIF21 DIBBs:STORM:大数据时空在线推理与管理
  • 批准号:
    1443046
  • 财政年份:
    2014
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
CT-ISG: Collaborative Research: Towards Trustworthy Database Systems
CT-ISG:协作研究:迈向可信赖的数据库系统
  • 批准号:
    1243971
  • 财政年份:
    2012
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
CAREER: Novel Query Processing Techniques for Distributed Probabilistic Data
职业:分布式概率数据的新颖查询处理技术
  • 批准号:
    1200792
  • 财政年份:
    2011
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Continuing Grant
III: Small: Efficient Ranking and Aggregate Query Processing for Probabilistic Data
III:小:概率数据的高效排序和聚合查询处理
  • 批准号:
    1212310
  • 财政年份:
    2011
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Continuing Grant
CAREER: Novel Query Processing Techniques for Distributed Probabilistic Data
职业:分布式概率数据的新颖查询处理技术
  • 批准号:
    1053979
  • 财政年份:
    2011
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Continuing Grant
III: Small: Efficient Ranking and Aggregate Query Processing for Probabilistic Data
III:小:概率数据的高效排序和聚合查询处理
  • 批准号:
    0916488
  • 财政年份:
    2009
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Continuing Grant
CT-ISG: Collaborative Research: Towards Trustworthy Database Systems
CT-ISG:协作研究:迈向可信赖的数据库系统
  • 批准号:
    0831278
  • 财政年份:
    2008
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
  • 批准号:
    1723292
  • 财政年份:
    2017
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: Data Management for Analytics Applications on Modern Architecture
BIGDATA:小型:DCM:现代架构上分析应用程序的数据管理
  • 批准号:
    1250886
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
  • 批准号:
    1251267
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: JetStream: A Flexible Distributed System for Online and In-Place Data Analysis
BIGDATA:小型:DCM:JetStream:用于在线和就地数据分析的灵活分布式系统
  • 批准号:
    1250990
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
  • 批准号:
    1251037
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
  • 批准号:
    1251095
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: DA: Collaborative Research: SMASH -- Scalable Multimedia content AnalysiS in a High-level language
大数据: 小: DCM: DA: 协作研究: SMASH - 使用高级语言进行可扩展多媒体内容分析
  • 批准号:
    1251276
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small DCM: ESCA DA Computational infrastructure for massive neurosci
大数据:小型 DCM:ESCA DA 大规模神经科学计算基础设施
  • 批准号:
    8599834
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
BIGDATA: Small: DCM: ESCE: Condensate Database for Efficient Anomaly Detection and Quality Assurance of Massive Cryospheric Data
大数据:小型:DCM:ESCE:用于高效异常检测和海量冰冻圈数据质量保证的凝结水数据库
  • 批准号:
    1251257
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DCM: Open Flow Enabled Hadoop over Local and Wide Area Clusters
BIGDATA:小型:DCM:本地和广域集群上支持开放流的 Hadoop
  • 批准号:
    1251201
  • 财政年份:
    2013
  • 资助金额:
    $ 68.54万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了