Histogram-based Query Estimation for Datasets with different Modalities

不同模态数据集的基于直方图的查询估计

基本信息

  • 批准号:
    0209112
  • 负责人:
  • 金额:
    $ 28.71万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2002
  • 资助国家:
    美国
  • 起止时间:
    2002-08-15 至 2005-12-31
  • 项目状态:
    已结题

项目摘要

Data summarization and estimation can serve as a useful tool for a diverse set of applications ranging from traditional database query optimization to OLAP applications and the exploration of large data sets. During the course of this project, data estimation and summarization techniques will be developed for datasets with different modalities: point datasets, datasets containing objects with spatial extents, and stream datsets. The approach is specifically based on the use of histograms in different contexts. One of the main problems of applying estimation techniques in a database management system is the unknown characteristic of the distribution of the data that will populate a given DBMS. In fact, in order for such a technique to be useful, the estimation technique should be effective for different kinds of data distributions and query patterns. This is because a DBMS is used for a variety of applications resulting in a wide spectrum of data that populates the database. A new estimation technique called the golden estimator has been identified that employs cumulative probability distributions for creating histograms and captures the underlying data distribution. This technique can also be used to adapt to changes in the query patterns. For objects with spatial extents, this project will lead to histograms derived from Euler's formulation for graphs. For stream datasets, a variety of approaches will be explored that are amenable to maintain histograms dynamically. The research results will be evaluated in the context of the Alexandria Digital Library and the Digital Campus projects at UCSB.
数据汇总和估计可以作为一个有用的工具,用于各种各样的应用程序,从传统的数据库查询优化到OLAP应用程序和大型数据集的探索。 在这个项目的过程中,数据估计和总结技术将开发不同形式的数据集:点数据集,数据集包含对象的空间范围,和流数据集。 该方法特别基于在不同上下文中使用直方图。 在数据库管理系统中应用估计技术的主要问题之一是填充给定DBMS的数据的分布的未知特性。 事实上,为了使这种技术有用,估计技术应该对不同类型的数据分布和查询模式有效。 这是因为DBMS用于各种应用程序,从而导致填充数据库的数据范围很广。 一种新的估计技术称为黄金估计器已被确定,采用累积概率分布创建直方图,并捕捉底层数据分布。这种技术也可以用来适应查询模式的变化。 对于具有空间范围的对象,该项目将导致从欧拉的图形公式导出的直方图。对于流数据集,将探索各种方法,这些方法可以动态维护直方图。研究结果将在亚历山大数字图书馆和UCSB数字校园项目的背景下进行评估。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Divyakant Agrawal其他文献

Progressive Partitioning for Parallelized Query Execution in Google's Napa
Google Napa 中并行查询执行的渐进分区
  • DOI:
    10.14778/3611540.3611541
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Tatemura;Tao Zou;Jagan Sankaranarayanan;Yanlai Huang;Jim Chen;Yupu Zhang;Kevin Lai;Hao Zhang;G. Manoharan;G. Graefe;Divyakant Agrawal;Brad Adelberg;Shilpa Kolhar;Indrajit Roy
  • 通讯作者:
    Indrajit Roy
$\mathcal{MD}$ -HBase: design and implementation of an elastic data infrastructure for cloud-scale location services
  • DOI:
    10.1007/s10619-012-7109-z
  • 发表时间:
    2012-09-05
  • 期刊:
  • 影响因子:
    0.900
  • 作者:
    Shoji Nishimura;Sudipto Das;Divyakant Agrawal;Amr El Abbadi
  • 通讯作者:
    Amr El Abbadi
MEMS based storage architecture for relational databases
  • DOI:
    10.1007/s00778-005-0176-2
  • 发表时间:
    2007-01-11
  • 期刊:
  • 影响因子:
    3.800
  • 作者:
    Hailing Yu;Divyakant Agrawal;Amr El Abbadi
  • 通讯作者:
    Amr El Abbadi
Llama
骆驼
Optimal Scheduling Algorithms for Tertiary Storage
  • DOI:
    10.1023/a:1025589332623
  • 发表时间:
    2003-11-01
  • 期刊:
  • 影响因子:
    0.900
  • 作者:
    Sunil Prabhakar;Divyakant Agrawal;Amr El Abbadi
  • 通讯作者:
    Amr El Abbadi

Divyakant Agrawal的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Divyakant Agrawal', 18)}}的其他基金

CSR: Small: Data on the Edge: Leveraging Edge Datacenters for Low-latency, Fault-tolerant, mobile Geo-replicated Transactional Data Stores
CSR:小型:边缘数据:利用边缘数据中心实现低延迟、容错、移动地理复制事务数据存储
  • 批准号:
    1815733
  • 财政年份:
    2018
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
The NSF PI Meeting: The Science of Cloud Computing
NSF PI 会议:云计算科学
  • 批准号:
    1123954
  • 财政年份:
    2011
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
NSF EAGER: Data-Driven Framework for Analyzing User Interactions in Social Media
NSF EAGER:用于分析社交媒体中用户交互的数据驱动框架
  • 批准号:
    1135389
  • 财政年份:
    2011
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
III:Small:Transactional Data Stores in the Cloud
III:小:云中的事务数据存储
  • 批准号:
    1018637
  • 财政年份:
    2010
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Continuing Grant
NSF EAGER: From a Virtualized Computing Nucleus to a Cloud Computing Universe
NSF EAGER:从虚拟化计算核心到云计算宇宙
  • 批准号:
    1053594
  • 财政年份:
    2010
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
US-Based Students Support to Attend the ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems 2010 (ACM SIGSPATIAL GIS 2010)
支持美国学生参加 2010 年 ACM SIGSPATIAL 地理信息系统进展国际会议 (ACM SIGSPATIAL GIS 2010)
  • 批准号:
    1049534
  • 财政年份:
    2010
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
RR: Wireless Sensor Network Laboratory Infrastructure
RR:无线传感器网络实验室基础设施
  • 批准号:
    0423336
  • 财政年份:
    2004
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Continuing Grant
ITR: Hardware Acceleration of Database Operations
ITR:数据库操作的硬件加速
  • 批准号:
    0220152
  • 财政年份:
    2002
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Continuing Grant
CISE Research Instrumentation: Scalable Storage Servers for Advanced Information Systems
CISE 研究仪器:用于高级信息系统的可扩展存储服务器
  • 批准号:
    9818320
  • 财政年份:
    1999
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
Exploiting Storage Redundancy and Parallelism for Efficient Retrieval of Multimedia Data
利用存储冗余和并行性有效检索多媒体数据
  • 批准号:
    9970700
  • 财政年份:
    1999
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
  • 批准号:
    W2433169
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
  • 批准号:
    52301178
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
NbZrTi基多主元合金中化学不均匀性对辐照行为的影响研究
  • 批准号:
    12305290
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
眼表菌群影响糖尿病患者干眼发生的人群流行病学研究
  • 批准号:
    82371110
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
镍基UNS N10003合金辐照位错环演化机制及其对力学性能的影响研究
  • 批准号:
    12375280
  • 批准年份:
    2023
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
CuAgSe基热电材料的结构特性与构效关系研究
  • 批准号:
    22375214
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
基于大数据定量研究城市化对中国季节性流感传播的影响及其机理
  • 批准号:
    82003509
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    2401096
  • 财政年份:
    2023
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
Part-based 3D shape retrieval using multi-modal query
使用多模态查询进行基于零件的 3D 形状检索
  • 批准号:
    21K11903
  • 财政年份:
    2021
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Query-and-Learn Machine Learning framework to model the stability mechanism of REFe12 magnets
用于模拟 REFe12 磁体稳定性机制的查询和学习机器学习框架
  • 批准号:
    21K14396
  • 财政年份:
    2021
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
III: Small: COMPASS: Online Sketch-based Query Optimization for In-Memory Databases
III:小:COMPASS:内存数据库基于草图的在线查询优化
  • 批准号:
    2008815
  • 财政年份:
    2020
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
Efficient Query Processing for Learning-based Data Management
基于学习的数据管理的高效查询处理
  • 批准号:
    19K11979
  • 财政年份:
    2019
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    1817239
  • 财政年份:
    2018
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Standard Grant
Query-based legal information retrieval system
基于查询的法律信息检索系统
  • 批准号:
    507218-2016
  • 财政年份:
    2017
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Applied Research and Development Grants - Level 1
The Second-Order Approach and its Application to View-Based Query Processing
二阶方法及其在基于视图的查询处理中的应用
  • 批准号:
    264466967
  • 财政年份:
    2015
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Research Grants
Integrating Topic Modeling and Rhetorical Parsing for Query-Based Summarization
集成主题建模和修辞分析以进行基于查询的摘要
  • 批准号:
    482298-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 28.71万
  • 项目类别:
    University Undergraduate Student Research Awards
metis - Knowledge-based search and query methods for accessing information of semantic models (BIM) to support searching in early design stages.
metis - 基于知识的搜索和查询方法,用于访问语义模型(BIM)信息以支持早期设计阶段的搜索。
  • 批准号:
    235841221
  • 财政年份:
    2013
  • 资助金额:
    $ 28.71万
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了