III: Small: Persistent Data Summaries: Temporal Analytics on Big Data Histories

III:小:持久数据摘要:大数据历史的时态分析

基本信息

  • 批准号:
    1816149
  • 负责人:
  • 金额:
    $ 49.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2023-08-31
  • 项目状态:
    已结题

项目摘要

An increasing number of applications require the storage of and access to all historical data to support rich analytics, learning, and mining operations. This project develops a series of methods to summarize data so that it can be queried with respect to not just the full data set, as is standard, but with respect to the state of the data set at any historical time. These summaries integrate with large temporal databases, in both offline batched-processing and online streaming application scenarios. The effectiveness of these methods will be demonstrated on an enormous scientific database of atmospheric data collected for 20 years from over 40,000 weather stations. We will work with industry collaborators to help deploy our new algorithms, and the results will be integrated into education and outreach efforts surrounding the growth of data science initiatives. More specifically, this project extends and combines approximate query processing with temporal big data. In particular, instead of (or on top of) using a multi-version database, this project designs and implements persistent data summaries (PDSs) that offer interactive temporal analytics with strong theoretical guarantees on their approximation quality. In additional to formalizing these models, this project develops practical PDS implementations for sampling-based summaries, data sketches, and core sets that support advanced analytical queries.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
越来越多的应用程序需要存储和访问所有历史数据,以支持丰富的分析、学习和挖掘操作。该项目开发了一系列汇总数据的方法,以便不仅可以按照标准针对整个数据集进行查询,而且可以针对任何历史时间的数据集的状态进行查询。这些摘要与大型时态数据库集成,在离线批处理和在线流应用场景中都是如此。这些方法的有效性将在一个巨大的科学数据库上得到验证,该数据库收集了40,000多个气象站20年来的大气数据。我们将与行业合作伙伴合作,帮助部署我们的新算法,结果将整合到围绕数据科学倡议增长的教育和推广工作中。更具体地说,该项目扩展并结合了近似查询处理和时态大数据。特别是,该项目不使用(或在其上)使用多版本数据库,而是设计并实现了持久数据摘要(PDS),该PDS提供交互式时态分析,并为其近似质量提供强有力的理论保证。除了将这些模型正式化外,该项目还为基于采样的摘要、数据草图和支持高级分析查询的核心集开发了实用的PDS实施。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scalable Spatial Scan Statistics for Trajectories
The GaussianSketch for Almost Relative Error Kernel Distance
  • DOI:
    10.4230/lipics.approx/random.2020.12
  • 发表时间:
    2018-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. M. Phillips;W. Tai
  • 通讯作者:
    J. M. Phillips;W. Tai
At-the-time and Back-in-time Persistent Sketches
当时和过去的持久草图
Sketching Multidimensional Time Series for Fast Discord Mining
绘制多维时间序列以进行快速不一致挖掘
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yeh, Chin-Chia Michael;Zheng, Yan;Pan, Menghai;Chen, Huiyuan;Zhuang, Zhongfang;Wang, Junpeng;Wang, Liang;Zhang, Wei;Phillips, Jeff M.;Keogh, Eamonn
  • 通讯作者:
    Keogh, Eamonn
Persistent Bloom Filter: Membership Testing for the Entire History
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jeff Phillips其他文献

Cerebellar cortical degeneration in adult American Staffordshire Terriers.
成年美国斯塔福郡梗犬的小脑皮质变性。
  • DOI:
    10.1111/j.1939-1676.2004.tb00161.x
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    2.6
  • 作者:
    N. Olby;S. Blot;J. Thibaud;Jeff Phillips;D. O’Brien;J. Burr;J. Berg;T. Brown;M. Breen
  • 通讯作者:
    M. Breen
C APTURING U SER I NTENT WHEN B RUSHING IN S CATTERPLOTS
在刷 S Catterplots 时捕捉用户意图
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Gadhave;Jochen Görtler;Zach Cutler;C. Nobre;Oliver Deussen;Miriah Meyer;Jeff Phillips;Alexander Lex;Carolina No
  • 通讯作者:
    Carolina No
Use of modified barium swallow study to measure posterior airway space in obstructive sleep apnea
使用改良的吞钡研究测量阻塞性睡眠呼吸暂停的后气道空间
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    1.4
  • 作者:
    Tyler Crosby;Jeff Phillips;A. Carbo;Kelley Babcock;C. Nathan
  • 通讯作者:
    C. Nathan
Interpretable Debiasing of Vectorized Language Representations with Iterative Orthogonalization
通过迭代正交化矢量化语言表示的可解释去偏
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prince Osei Aboagye;Yan Zheng;Jack Shunn;Chin-Chia Michael Yeh;Junpeng Wang;Zhongfang Zhuang;Huiyuan Chen;Liang Wang;Wei Zhang;Jeff Phillips
  • 通讯作者:
    Jeff Phillips

Jeff Phillips的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jeff Phillips', 18)}}的其他基金

III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
  • 批准号:
    2311954
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
AF: Small: The Geometry of Learning on Structured Data Objects
AF:小:结构化数据对象学习的几何
  • 批准号:
    2115677
  • 财政年份:
    2021
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Towards a Database Engine for Interactive and Online Sampling and Analytics
III:小型:面向交互式在线采样和分析的数据库引擎
  • 批准号:
    1619287
  • 财政年份:
    2016
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
CAREER: Foundations for Geometric Analysis of Noisy Data
职业:噪声数据几何分析的基础
  • 批准号:
    1350888
  • 财政年份:
    2014
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Cache-Coherent Accelerators for Efficient Persistent Memory Programming
CSR:小型:用于高效持久内存编程的缓存一致性加速器
  • 批准号:
    2245999
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Complex WTC Exposures Impacting Persistent Large and Small Airflow Limitation and Vulnerable Subgroups in the WTC Survivor Population
复杂的世贸中心暴露影响了世贸中心幸存者群体中持续的大、小气流限制和弱势群体
  • 批准号:
    10749125
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
Collaborative Research: CNS Core: Small: Scalable ACID Transactions for Persistent Memory Databases
合作研究:CNS 核心:小型:持久内存数据库的可扩展 ACID 事务
  • 批准号:
    2227066
  • 财政年份:
    2022
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
CNS Core: Small: Rethinking High-Performance Persistent Transactions
CNS 核心:小型:重新思考高性能持久事务
  • 批准号:
    2106117
  • 财政年份:
    2021
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
SHF: Small: PMChecker: Tool Support for Crash-Consistent Persistent Memory Programs
SHF:小型:PMChecker:对崩溃一致持久内存程序的工具支持
  • 批准号:
    2102940
  • 财政年份:
    2021
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS core: OAC core: Small: New Techniques for I/O Behavior Modeling and Persistent Storage Device Configuration
合作研究: CNS 核心:OAC 核心:小型:I/O 行为建模和持久存储设备配置新技术
  • 批准号:
    2008324
  • 财政年份:
    2020
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS CORE: Small: Scalable ACID Transactions for Persistent Memory Databases
合作研究:CNS CORE:小型:持久内存数据库的可扩展 ACID 事务
  • 批准号:
    2008667
  • 财政年份:
    2020
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Scalable ACID Transactions for Persistent Memory Databases
合作研究:CNS 核心:小型:持久内存数据库的可扩展 ACID 事务
  • 批准号:
    2008884
  • 财政年份:
    2020
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS core: OAC core: Small: New Techniques for I/O Behavior Modeling and Persistent Storage Device Configuration
合作研究: CNS 核心:OAC 核心:小型:I/O 行为建模和持久存储设备配置新技术
  • 批准号:
    2008072
  • 财政年份:
    2020
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Partitioning Big Data for the High Performance Computation of Persistent Homology
III:小:对大数据进行分区以实现持久同调的高性能计算
  • 批准号:
    1909096
  • 财政年份:
    2019
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了