CIF: Small: Collaborative Research:Compressed databases for similarity queries: fundamental limits and algorithms

CIF:小型:协作研究:用于相似性查询的压缩数据库:基本限制和算法

基本信息

  • 批准号:
    1319304
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-07-01 至 2017-06-30
  • 项目状态:
    已结题

项目摘要

Project abstract Information theory has had a profound impact on the fields of data transmission and compression. In contrast, it has yielded comparably few insights into problems such as knowledge extraction from and efficient search of massive datasets. While current information-theoretic tools and techniques can be applied to these problems to some extent, the paradigms for which these tools were developed will be being carefully reexamined in this project. Models that accurately capture the fundamental challenges faced by efficient search in modern massive database systems will be developed and analyzed. The asymptotic fundamental limits, which characterize the tradeoffs between accuracy, compression rate and search efficiency, will be investigated, along with development of practical algorithms that approach the ultimate benchmarks. One concrete problem being pursued is that of compression for efficient query and search. In this setting, the goal is, given a compressed representation, to answer search queries about the data that was compressed. This is in stark contrast to traditional compression, where the data need be merely reconstructible from the compressed form. The approach taken is tailored to distributed database design, but is also relevant to compression schemes that allow search within the compressed domain. The fundamental quantities studied play a similar role to that of the channel capacity and entropy/rate-distortion in channel and source coding, respectively. On one hand, they yield an understanding of the fundamental limits on the performance that any system for similarity queries based on compressed representations can hope to attain. On the other, the insights obtained from the theory are guiding the construction of schemes that approach these limits in practice. We will investigate how existing practical approaches (such as various hashing and clustering techniques) perform with respect to the information theoretic limits, and the extent to which approaches that have proved to be practical in source and channel coding can be used as building blocks to develop new efficient search algorithms that significantly improve on the current state of the art
信息论对数据传输和压缩领域产生了深远的影响。相比之下,它对诸如从大规模数据集中提取知识和有效搜索等问题的见解很少。虽然目前的信息理论工具和技术可以在一定程度上应用于这些问题,这些工具的开发模式将在本项目中仔细重新审查。将开发和分析准确捕捉现代大型数据库系统中高效搜索所面临的基本挑战的模型。的渐近基本限制,其特征之间的权衡精度,压缩率和搜索效率,将被调查,沿着发展的实际算法,接近最终的基准。一个具体的问题是压缩,有效的查询和搜索。在这种情况下,目标是在给定压缩表示的情况下回答关于压缩数据的搜索查询。这与传统的压缩形成鲜明对比,传统的压缩只需要从压缩形式中重建数据。所采取的方法是专门为分布式数据库设计,但也相关的压缩方案,允许在压缩域搜索。所研究的基本量分别在信道和信源编码中起着与信道容量和熵/率失真类似的作用。一方面,他们产生的基本限制的性能,任何系统的相似性查询的基础上压缩表示可以希望达到的理解。另一方面,从理论中获得的见解正在指导实践中接近这些极限的方案的构建。我们将研究现有的实用方法(如各种散列和聚类技术)如何执行相对于信息理论的限制,以及在何种程度上,已被证明是实用的信源和信道编码的方法可以被用作构建块,以开发新的有效的搜索算法,显着改善目前的最新技术水平

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sergio Verdu其他文献

Sergio Verdu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sergio Verdu', 18)}}的其他基金

2016 IEEE International Symposium on Information Theory Student Travel Support
2016 IEEE国际信息论研讨会学生出行支持
  • 批准号:
    1611969
  • 财政年份:
    2016
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Non-Asymptotic Information Theory
CIF:小:非渐近信息论
  • 批准号:
    1016625
  • 财政年份:
    2010
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: TF: Information Theory of Channels with Missing Observations
合作研究:TF:缺失观测值的通道信息论
  • 批准号:
    0728445
  • 财政年份:
    2007
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Reliable Communication with Feedback: Coding Schemes and Fundamental Limits
可靠的反馈沟通:编码方案和基本限制
  • 批准号:
    0635154
  • 财政年份:
    2006
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
ITR: Universal Discrete Denoising
ITR:通用离散去噪
  • 批准号:
    0312839
  • 财政年份:
    2003
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
ITR: Noiseless Data Compression Based on Error Correcting Codes
ITR:基于纠错码的无噪声数据压缩
  • 批准号:
    0312879
  • 财政年份:
    2003
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Group Travel for U.S. Participants for 2000 IEEE International Symposium on Information Theory
2000年IEEE国际信息论研讨会美国参会者团体旅游
  • 批准号:
    9908665
  • 财政年份:
    2000
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Random Matrices in Wireless Communication
无线通信中的随机矩阵
  • 批准号:
    0074277
  • 财政年份:
    2000
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Information Theory of Timing Channels
定时通道信息论
  • 批准号:
    9523805
  • 财政年份:
    1996
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Travel Support to the 1990 IEEE Workshop on Information Theory
1990 年 IEEE 信息论研讨会的差旅支持
  • 批准号:
    9014965
  • 财政年份:
    1990
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Designing Plotkin Transform Codes via Machine Learning
协作研究:CIF:小型:通过机器学习设计 Plotkin 转换代码
  • 批准号:
    2312753
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Hypergraph Signal Processing and Networks via t-Product Decompositions
合作研究:CIF:小型:通过 t 产品分解的超图信号处理和网络
  • 批准号:
    2230161
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312871
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了