Computing over Compressed Graph-Structured Data
压缩图结构数据的计算
基本信息
- 批准号:EP/X039447/1
- 负责人:
- 金额:$ 52.92万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2024
- 资助国家:英国
- 起止时间:2024 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The project aims to bring computation over compressed data to massive graph-structured datasets by extending optimally-compressed tree data structures we developed to certain classes of graphs. Graph-structured datasets such as knowledge graphs or social networks are growing in importance and size; at the same time, computation is increasingly pushed to mobile devices with limited memory capacity. Many applications yield large, but partially repetitive and predictable datasets, which makes them compressible; but on mobile devices, data is only useful when it can be queried directly in a compressed representation that fits into the device memory. Current methods for computing over compressed data do not yet work well for this scenario.In order to enable queries on compressed graph-structured data we need to answer three research questions.1. We need to know the intrinsic information content of graph-structured data so that we can decide whether a dataset can be sufficiently compressed to fit into local memory. 2. We need to know how to effectively compress graph-structured data, so that we can economically transmit and store graph-structured data on mobile devices. 3. We need to know how to answer queries on a compressed representation, so that we can make effective use of its compressibility while querying over a graph-structured dataset. This project will combine methods from information theory, data compression, and succinct data structures, to carry out three work packages.1. We will propose new notions of random sources and empirical entropy in order to approximate the intrinsic information content of graph-structured data. 2. We will develop new compression methods based on probabilistic context-free grammars (PCFGs) and probabilistic multiple context-free grammars (PMCFGs) in order to effectively compress graph-structured data. 3. We will apply and extend our tools for succinct tree data structures to new types of graphs and RNA structure data in order to enable computing directly over compressed graph-structured data. We will use the outcomes of the work packages to create a versatile toolbox of space-efficient data structures to ease the development of applications working with massive graph-structured datasets.
该项目旨在通过将我们开发的最佳压缩树数据结构扩展到某些类别的图,将压缩数据的计算带到海量图结构数据集。知识图谱或社交网络等图结构数据集的重要性和规模都在不断增长;与此同时,计算越来越多地被推向内存容量有限的移动的设备。许多应用程序会产生大型但部分重复且可预测的数据集,这使得它们可压缩;但在移动的设备上,数据只有在可以直接以适合设备内存的压缩表示形式进行查询时才有用。目前的压缩数据计算方法还不能很好地适用于这种情况。为了使查询压缩图结构数据,我们需要回答三个研究问题。我们需要知道图结构数据的内在信息内容,以便我们可以决定数据集是否可以被充分压缩以适应本地内存。2.我们需要知道如何有效地压缩图结构数据,以便我们可以经济地在移动的设备上传输和存储图结构数据。3.我们需要知道如何在压缩表示上回答查询,这样我们就可以在查询图结构数据集时有效地利用其可压缩性。本计画将结合联合收割机的资讯理论、资料压缩、简洁资料结构等方法,进行三个工作包.我们将提出随机源和经验熵的新概念,以近似图结构数据的内在信息内容。2.为了有效地压缩图结构数据,我们将开发基于概率上下文无关文法(PCFG)和概率多上下文无关文法(PMCFG)的新压缩方法。3.我们将应用和扩展我们的工具,简洁的树数据结构的新类型的图形和RNA结构的数据,以使计算直接在压缩的图形结构的数据。我们将使用工作包的结果来创建一个多功能的空间高效数据结构工具箱,以简化使用大量图形结构数据集的应用程序的开发。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sebastian Wild其他文献
RNA secondary structures: from ab initio prediction to better compression, and back
RNA 二级结构:从从头开始预测到更好的压缩,然后返回
- DOI:
10.1109/dcc55655.2023.00036 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Eva Onokpasa;Sebastian Wild;Prudence W. H. Wong - 通讯作者:
Prudence W. H. Wong
Polyamorous Scheduling
多角调度
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
L. Gąsieniec;Benjamin Smith;Sebastian Wild - 通讯作者:
Sebastian Wild
Mycobacterial infection aggravates emHelicobacter pylori/em-induced gastric preneoplastic pathology by redirection of emde novo/em induced Treg cells
- DOI:
10.1016/j.celrep.2022.110359 - 发表时间:
2022-02-08 - 期刊:
- 影响因子:6.900
- 作者:
Mariela Artola-Borán;Angela Fallegger;Martina Priola;Rima Jeske;Tim Waterboer;Anders B. Dohlman;Xiling Shen;Sebastian Wild;Jiazhuo He;Mitchell P. Levesque;Shida Yousefi;Hans-Uwe Simon;Phil F. Cheng;Anne Müller - 通讯作者:
Anne Müller
Succinct Permutation Graphs
简洁排列图
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:1.1
- 作者:
Konstantinos Tsakalidis;Sebastian Wild;V. Zamaraev - 通讯作者:
V. Zamaraev
Dual-Pivot Quicksort and Beyond: Analysis of Multiway Partitioning and Its Practical Potential
双枢轴快速排序及其他:多路分区分析及其实际潜力
- DOI:
10.1109/isit.2017.8006830 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Sebastian Wild - 通讯作者:
Sebastian Wild
Sebastian Wild的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
面向IP over EON多层网络生存性流量疏导机理的研究
- 批准号:61671313
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
面向UWB-over-fiber的光生可调谐超宽带信号研究
- 批准号:61108027
- 批准年份:2011
- 资助金额:28.0 万元
- 项目类别:青年科学基金项目
基于QAM光载毫米波信号的10Gb/s RoF系统关键技术研究
- 批准号:61001061
- 批准年份:2010
- 资助金额:7.0 万元
- 项目类别:青年科学基金项目
基于约束行为的柔性精微机构设计方法研究
- 批准号:50975007
- 批准年份:2009
- 资助金额:38.0 万元
- 项目类别:面上项目
基于无线光载射频(Radio over Free Space Optics)技术的分布式天线系统关键技术研究
- 批准号:60902038
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于双路光相位调制光学倍频法的毫米波Radio Over Fiber系统研究
- 批准号:60877053
- 批准年份:2008
- 资助金额:42.0 万元
- 项目类别:面上项目
小桐子种子油含量关键靶基因的克隆与调控研究
- 批准号:30871548
- 批准年份:2008
- 资助金额:30.0 万元
- 项目类别:面上项目
毫米波光纤无线系统理论与技术
- 批准号:60736003
- 批准年份:2007
- 资助金额:190.0 万元
- 项目类别:重点项目
新一代互联网络体系结构与协议理论
- 批准号:90704001
- 批准年份:2007
- 资助金额:100.0 万元
- 项目类别:重大研究计划
基于正交调制FSK/ASK 的IP-over-DWDM、FSK 光标记交换关键技术研究
- 批准号:60677004
- 批准年份:2006
- 资助金额:21.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: AGS-FIRP Track 2--Process Investigation of Clouds and Convective Organization over the atLantic Ocean (PICCOLO)
合作研究:AGS-FIRP Track 2——大西洋上空云和对流组织的过程调查(PICCOLO)
- 批准号:
2331199 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Continuing Grant
Tracking flood waters over Australia using space gravity data
使用空间重力数据跟踪澳大利亚的洪水
- 批准号:
DP240102399 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Discovery Projects
Charting the brain's wiring over the human lifespan
绘制人类一生中大脑的接线图
- 批准号:
DE240101035 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Discovery Early Career Researcher Award
IgA and IgM superiority over IgG in neutralizing SARS-CoV-2: Clarifying the mechanisms and application
IgA 和 IgM 在中和 SARS-CoV-2 方面优于 IgG:阐明机制和应用
- 批准号:
24K18274 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
EAGER: Fertilizing the Tree of Life with novel taxa from deep-sea vent microbial metagenomes collected over time and space
EAGER:用随时间和空间收集的深海喷口微生物宏基因组中的新类群为生命之树施肥
- 批准号:
2409507 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Standard Grant
Collaborative Research: AGS-FIRP Track 2--Process Investigation of Clouds and Convective Organization over the atLantic Ocean (PICCOLO)
合作研究:AGS-FIRP Track 2——大西洋上空云和对流组织的过程调查(PICCOLO)
- 批准号:
2331200 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Continuing Grant
CRII: CSR: Towards an Edge-enabled Software-Defined Vehicle Framework for Dynamic Over-the-Air Updates
CRII:CSR:迈向支持边缘的软件定义车辆框架,用于动态无线更新
- 批准号:
2348151 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Standard Grant
CAREER: Information Propagation over Networks
职业:网络信息传播
- 批准号:
2337808 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Continuing Grant
Enhanced carbon export driven by internal tides over the mid-Atlantic ridge (CarTRidge)
大西洋中脊内潮汐推动碳输出增强 (CarTRidge)
- 批准号:
NE/X013758/1 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Research Grant
Engaging the over 50s to ensure the sustainability of our blood supply
让 50 多岁的人参与进来,确保我们血液供应的可持续性
- 批准号:
LP220200819 - 财政年份:2024
- 资助金额:
$ 52.92万 - 项目类别:
Linkage Projects