EAGER:CCF:AF:Sublinear Data Structures for Approximate Queries

EAGER:CCF:AF:用于近似查询的次线性数据结构

基本信息

  • 批准号:
    2137057
  • 负责人:
  • 金额:
    $ 22.58万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Computer science is a fast growing field which has opened up new possibilities with more and more availability of data and novel applications. Efficiency in computing becomes an important issue not only due to speed and hardware requirements but also because computers consume a significant chunk of world’s energy resources. The main challenge is to efficiently store, organize and manage data so that one can retrieve and infer intelligent information from the data in real time. In modern applications, data lies in the cloud, and to answer queries on the data one makes data structural index – which resides locally or in fast memory. This project considers design and development of sublinear data structures which will enable answering of queries on massive data sets. These data structures will serve as building blocks for fields like databases, information retrieval, bioinformatics and geographic information systems. Data structures being a core course in all computer science curricula, the outcomes of this project will be enrich the course on data structures that the investigator teaches at LSU. Many of the results worked out here could become interesting implementation and algorithmic experimentation projects for the students taking the course. LSU Computer Science has high percentage of minority students who will benefit from this exposure. The investigator plans to continue high school and middle school outreach activities. Main goal in the field of succinct data structures is to design a data structure which takes the space equivalent to information theoretic minimum space required to represent the data and execute queries in polylogarithmic time. By separating the space for raw data and the space for indexing, this project explores the relationship between the space required for the indexing part and query type. The project will further explores if the space can be reduced by allowing the query answers to be approximate. The investigator will be considering fundamental queries like range-topk, range mode, and range quantiles along with different notions of approximations like approximate values, approximate ranks, approximate range boundaries and allowing additive errors in approximations. The main goal is to achieve meaningful sublinear indexes for an overarching range of problems and queries for which allow sublinear bounds. The investigator's attempt will be to categorize fundamental problems along with their upper and lower bounds. The project will identify meaningful models and fundamental problems which can be further used as primitives for wider range of problems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
计算机科学是一个快速发展的领域,随着越来越多的数据和新的应用程序的可用性,它开辟了新的可能性。计算效率成为一个重要的问题,不仅是由于速度和硬件要求,而且还因为计算机消耗了世界能源的很大一部分。主要的挑战是有效地存储、组织和管理数据,以便能够从数据中真实的实时检索和推断智能信息。在现代应用程序中,数据位于云中,为了回答对数据的查询,人们制作了数据结构索引-驻留在本地或快速内存中。该项目考虑设计和开发次线性数据结构,这将使大量数据集的查询的答案。这些数据结构将成为数据库、信息检索、生物信息学和地理信息系统等领域的基础。数据结构是所有计算机科学课程的核心课程,本项目的成果将丰富调查员在路易斯安那州立大学教授的数据结构课程。这里得出的许多结果可能会成为有趣的实现和算法实验项目,供参加课程的学生使用。路易斯安那州立大学计算机科学有很高比例的少数民族学生谁将受益于这种接触。研究者计划继续高中和中学的外展活动。 简洁数据结构领域的主要目标是设计一种数据结构,该数据结构占用的空间相当于在多对数时间内表示数据和执行查询所需的信息论最小空间。通过将原始数据空间和索引空间分离,本项目探索了索引部分所需空间与查询类型之间的关系。该项目将进一步探索是否可以通过允许查询答案是近似的来减少空间。研究者将考虑基本查询,如范围顶部、范围模式和范围分位数沿着,以及不同的近似值概念,如近似值、近似秩、近似范围边界和允许近似值中的附加误差。其主要目标是实现有意义的次线性索引的总体范围内的问题和查询,允许次线性边界。研究者的尝试是将基本问题沿着它们的上界和下界分类。该项目将确定有意义的模型和基本问题,这些模型和基本问题可以进一步用作更广泛问题的基元。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Fully Functional Parameterized Suffix Trees in Compact Space
紧凑空间中的全功能参数化后缀树
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ganguly, Arnab;Shah, Rahul;Thankachan, Sharma V.
  • 通讯作者:
    Thankachan, Sharma V.
Ranked Document Retrieval in External Memory
外部存储器中的排名文档检索
  • DOI:
    10.1145/3559763
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    1.3
  • 作者:
    Shah, Rahul;Sheng, Cheng;Thankachan, Sharma;Vitter, Jeffrey
  • 通讯作者:
    Vitter, Jeffrey
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rahul Shah其他文献

Structural Pattern Matching - Succinctly
结构模式匹配 - 简洁
Faster Compressed Top-k Document Retrieval
更快的压缩 Top-k 文档检索
  • DOI:
    10.1109/dcc.2013.42
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    W. Hon;Sharma V. Thankachan;Rahul Shah;J. Vitter
  • 通讯作者:
    J. Vitter
Space-efficient indexes for forbidden extension queries
用于禁止扩展查询的节省空间的索引
  • DOI:
    10.1016/j.jda.2018.09.001
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sudip Biswas;Arnab Ganguly;Rahul Shah;Sharma V. Thankachan
  • 通讯作者:
    Sharma V. Thankachan
Compressed Property Suffix Trees
压缩属性后缀树
  • DOI:
    10.1016/j.ic.2013.09.001
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    W. Hon;Manish Patil;Rahul Shah;Sharma V. Thankachan
  • 通讯作者:
    Sharma V. Thankachan
I/O-Efficient Compressed Text Indexes: From Theory to Practice
I/O 高效的压缩文本索引:从理论到实践
  • DOI:
    10.1109/dcc.2010.45
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sheng;W. Hon;Rahul Shah;J. Vitter
  • 通讯作者:
    J. Vitter

Rahul Shah的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rahul Shah', 18)}}的其他基金

AF: DC: Collaborative Research: Pattern Matching for Massive Data Sets
AF:DC:协作研究:海量数据集的模式匹配
  • 批准号:
    1017623
  • 财政年份:
    2010
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
International Research Fellowship Program: Laser-Based Femtosecond X-Ray Development and Application
国际研究奖学金计划:基于激光的飞秒X射线开发和应用
  • 批准号:
    0502281
  • 财政年份:
    2005
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Fellowship

相似国自然基金

液相法药物共晶制备中CCF/溶剂体系高效筛选方法及共晶成核生长机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目
莪术醇调控CCF抗酒精性脂肪肝中肝细胞衰老的作用机制
  • 批准号:
    81900531
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
幽门螺杆菌疫苗CCF诱导胃组织驻留型记忆T细胞形成机制及免疫保护作用研究
  • 批准号:
    81971562
  • 批准年份:
    2019
  • 资助金额:
    53.0 万元
  • 项目类别:
    面上项目
基于适配子技术和纳米材料信号放大系统的ccf-miRNA电化学检测方法研究
  • 批准号:
    81672108
  • 批准年份:
    2016
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
ccf-mtDNA诱导小胶质细胞炎症反应及其影响衰老和肥胖的研究
  • 批准号:
    81670712
  • 批准年份:
    2016
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目

相似海外基金

CCF: AF: Medium: Towards Optimal Pseudorandomness
CCF:AF:中:走向最佳伪随机性
  • 批准号:
    2312573
  • 财政年份:
    2023
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Continuing Grant
CRII: CCF: AF: Decomposition Algorithms for nonconvex nonsmooth constrained stochastic programs
CRII:CCF:AF:非凸非光滑约束随机程序的分解算法
  • 批准号:
    2416172
  • 财政年份:
    2023
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
Collaborative Research: CCF: AF: Medium: Validated Soft Approaches to Parametric ODE Solving
协作研究:CCF:AF:中:经过验证的参数 ODE 求解软方法
  • 批准号:
    2212461
  • 财政年份:
    2022
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Continuing Grant
Collaborative Research: CCF: AF: Medium: Validated Soft Approaches to Parametric ODE Solving
协作研究:CCF:AF:中:经过验证的参数 ODE 求解软方法
  • 批准号:
    2212460
  • 财政年份:
    2022
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Continuing Grant
CRII: CCF: AF: Decomposition Algorithms for nonconvex nonsmooth constrained stochastic programs
CRII:CCF:AF:非凸非光滑约束随机程序的分解算法
  • 批准号:
    2153352
  • 财政年份:
    2022
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
Collaborative Research: CCF: AF: Medium: Validated Soft Approaches to Parametric ODE Solving
协作研究:CCF:AF:中:经过验证的参数 ODE 求解软方法
  • 批准号:
    2212462
  • 财政年份:
    2022
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Continuing Grant
CCF: AF: Small: Algorithms, Parallelism and Communication Efficiency in Shortest Path Computations
CCF:AF:Small:最短路径计算中的算法、并行性和通信效率
  • 批准号:
    2008241
  • 财政年份:
    2020
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
CCF-BSF: AF: Small: Collaborative Research: Practice-Friendly Theory and Algorithms for Linear Regression Problems
CCF-BSF:AF:小型:协作研究:线性回归问题的实用理论和算法
  • 批准号:
    1814041
  • 财政年份:
    2018
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
CCF-BSF: AF: CIF: Small: Low Complexity Error Correction
CCF-BSF:AF:CIF:小:低复杂性纠错
  • 批准号:
    1814629
  • 财政年份:
    2018
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
CCF-BSF: AF: Small: Algorithms for Interactive Learning
CCF-BSF:AF:小型:交互式学习算法
  • 批准号:
    1813160
  • 财政年份:
    2018
  • 资助金额:
    $ 22.58万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了