Succinct Data Structures with Applications to Large Data Sets

简洁的数据结构及其在大数据集上的应用

基本信息

  • 批准号:
    418613-2012
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2017
  • 资助国家:
    加拿大
  • 起止时间:
    2017-01-01 至 2018-12-31
  • 项目状态:
    已结题

项目摘要

The problem of efficiently storing and retrieving information is an essential topic in computer science. During the past decades, various techniques have been developed to index data so that the useful information can be retrieved almost instantaneously by performing queries for keywords or phrases. In recent years, as the size of the data has grown rapidly, many techniques that were useful for small, older systems have become infeasible for large, modern applications because they occupy too much storage. Most of this space is not the raw data, but structural information added to improve search efficiency. Succinct data structures were proposed to address this problem, so that the information in large systems can be retrieved quickly, but the space requirement is little more than that of the raw data. In order to provide theoretical and practical solutions to modern systems that process large data sets such as web search engines, geographic information systems and bioinformatics applications, this program will extend the research on succinct data structures, and start new research directions on this subject. The proposed research will use succinct data structures to develop new solutions to fundamental problems in algorithms and computational geometry, such as text search and range search. It will start a new research direction that uses cache-oblivious model to improve the I/O efficiency of succinct data structures for applications that deal with large data sets stored in external memory. It will also start a new line of research by designing succinct data structures for bioinformatics applications and text databases by addressing useful types of searches performed in these systems, such as approximate search. In addition, algorithm engineering will be performed to study the efficiency of our solutions in practice, and code will be contributed to software libraries that deal with succinct data structures, to make them more complete and hence more useful for software development.
有效地存储和检索信息是计算机科学中的一个重要课题。在过去的几十年里,已经开发了各种技术来索引数据,从而可以通过执行对关键字或短语的查询来几乎即时地检索有用的信息。近年来,随着数据大小的快速增长,许多对小而旧的系统有用的技术已经变得不适用于大型的现代应用程序,因为它们占用了太多的存储空间。这些空间中的大部分不是原始数据,而是为提高搜索效率而添加的结构性信息。为了解决这一问题,人们提出了简洁的数据结构,以便快速检索大型系统中的信息,但空间需求与原始数据相差不大。为了给网络搜索引擎、地理信息系统和生物信息学应用等处理大数据集的现代系统提供理论和实用的解决方案,本项目将扩展对简洁数据结构的研究,并开启这一主题的新的研究方向。这项拟议的研究将使用简洁的数据结构来为算法和计算几何中的基本问题开发新的解决方案,例如文本搜索和范围搜索。这将开启一个新的研究方向,即使用缓存无关模型来提高存储在外部存储器中的大数据集处理应用程序的简洁数据结构的I/O效率。它还将开始一项新的研究,通过为生物信息学应用程序和文本数据库设计简洁的数据结构,解决在这些系统中执行的有用类型的搜索,如近似搜索。此外,还将进行算法工程,以研究我们解决方案在实践中的效率,并将代码贡献给处理简洁数据结构的软件库,使其更加完整,从而对软件开发更有用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

He, Meng其他文献

Propagation properties and self-reconstruction of azimuthally polarized non-diffracting beams
方位偏振非衍射光束的传播特性和自重构
  • DOI:
    10.1016/j.optcom.2012.12.019
  • 发表时间:
    2013-05
  • 期刊:
  • 影响因子:
    2.4
  • 作者:
    He, Meng;Chen, Ziyang;Sun, Shunhong;Pu, Jixiong
  • 通讯作者:
    Pu, Jixiong
Forensic psychiatric analysis of organic personality disorders after craniocerebral injury in Shanghai, China.
  • DOI:
    10.3389/fpsyt.2022.944888
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    4.7
  • 作者:
    Li, Beixu;Fang, Youxin;Lin, Junyi;Chen, Xueyan;Li, Chenhu;He, Meng
  • 通讯作者:
    He, Meng
Moisture and solvent responsive cellulose/SiO2 nanocomposite materials
  • DOI:
    10.1007/s10570-014-0527-5
  • 发表时间:
    2015-02-01
  • 期刊:
  • 影响因子:
    5.7
  • 作者:
    He, Meng;Duan, Bo;Zhang, Lina
  • 通讯作者:
    Zhang, Lina
Magnetoelectric transport and quantum interference effect in ultrathin manganite films
超薄锰酸盐薄膜中的磁电输运和量子干涉效应
  • DOI:
    10.1063/1.4873337
  • 发表时间:
    2014-04
  • 期刊:
  • 影响因子:
    4
  • 作者:
    Zhao, Rui-qiang;Guo, Hai-zhong;He, Meng;Yang, Guo-zhen
  • 通讯作者:
    Yang, Guo-zhen
MiR-142-3p as an Indicator of OSA Severity Predicts Prognosis in Lung Adenocarcinoma with OSA.
  • DOI:
    10.2147/nss.s385755
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Yang, Ting;He, Fang;Zhang, Mingxiang;Ai, Li;He, Meng;Liu, Xin;Li, Yongxia
  • 通讯作者:
    Li, Yongxia

He, Meng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('He, Meng', 18)}}的其他基金

Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2019
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2018
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Effective and Efficient Smart Meter Data Analytics
有效且高效的智能电表数据分析
  • 批准号:
    536292-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Engage Grants Program
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    418613-2012
  • 财政年份:
    2016
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    418613-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    418613-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    418613-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient algorithms and succinct data structures for acceleration of telescoping and related problems
用于加速伸缩及相关问题的高效算法和简洁数据结构
  • 批准号:
    RGPIN-2021-03147
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient algorithms and succinct data structures for acceleration of telescoping and related problems
用于加速伸缩及相关问题的高效算法和简洁数据结构
  • 批准号:
    RGPIN-2021-03147
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures
简洁的数据结构
  • 批准号:
    551960-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    University Undergraduate Student Research Awards
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2019
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    RGPIN-2018-05581
  • 财政年份:
    2018
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
Theory and Practice of Succinct Data Structures
简洁数据结构理论与实践
  • 批准号:
    16H02781
  • 财政年份:
    2016
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Succinct Data Structures with Applications to Large Data Sets
简洁的数据结构及其在大数据集上的应用
  • 批准号:
    418613-2012
  • 财政年份:
    2016
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了