CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms

CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法

基本信息

  • 批准号:
    1817634
  • 负责人:
  • 金额:
    $ 7.98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2019-06-30
  • 项目状态:
    已结题

项目摘要

Part 1: Coding for distributed storage systems has garnered significant attention in the past few years due to the rapid development of information technologies and the emergence of Big Data formats that need to be stored and disseminated across large-scale networks. As typical distributed systems need to ensure low-latency data access and store a large number of files over a set of nodes connected through a communication network, it is imperative to develop new distributed coding schemes that protect the systems from undesired component failures. The two key functionalities of codes used in distributed systems, namely the reconstruction of files via access to a subset of the nodes and repair of failed nodes, need to be retained when the files are accessed and processed by the users via symbol/block insertion, deletion, or substitution edits. Deletions frequently arise due to system-level data deduplication: when parts of files are deduplicated or edited, the changes in the information content need to be communicated to the redundant storage nodes with minimum communication cost. Current solutions for synchronizing data that underwent edits assume that data is uncoded and they do not fully exploit the distributed nature of information. Furthermore, they mostly ignore the presence of deduplication protocols. This makes distributed storage architectures inefficient in terms of storage, user access times, and error protection. Hence, the goals of the proposed research program are to develop a new set of protocols and coding schemes that will support a new generation of versatile and updatable coded distributed storage systems. Part 2: Building on the preliminary work of the investigators, this proposal aims to set the foundations of the new field of coded synchronization and deduplication, with the goal of deriving fundamental performance limits, developing efficient algorithmic solutions for the two families of problems, and constructing new distributed storage codes that enable synchronization of coded data and coded deduplication. In particular, the proposal addresses the following comprehensive issues: 1) Characterizing the communication rate limits of known and new (un)coded synchronization schemes, trade-offs between deduplication and data repair performance for different structured or encoded data formats and different types of communication channels.2) Introducing and analyzing the communication rate-distortion (CRD) function for approximate synchronization and deduplication of structured/encoded data, with a special focus on delay-sensitive applications.3) Developing dynamically updatable synchronization and deduplication algorithms cognizant of the network topology and of different prioritization needs of the users, as encountered in image and video data coding.
第一部分:由于信息技术的快速发展和需要在大规模网络中存储和传播的大数据格式的出现,分布式存储系统的编码在过去几年中引起了极大的关注。由于典型的分布式系统需要确保通过通信网络连接的一组节点上的低延迟数据访问和存储大量文件,因此开发新的分布式编码方案以保护系统免受意外组件故障的影响是必要的。分布式系统中使用的代码的两个关键功能,即通过访问节点子集来重建文件和修复故障节点,需要在用户通过符号/块插入、删除或替换编辑访问和处理文件时保留。系统级重复数据删除导致数据删除频繁,当对部分文件进行重复数据删除或编辑时,信息内容的变化需要以最小的通信成本传递给冗余存储节点。当前用于同步经过编辑的数据的解决方案假设数据是未编码的,并且它们没有充分利用信息的分布式特性。此外,它们大多忽略了重复数据删除协议的存在。这使得分布式存储体系结构在存储、用户访问时间和错误保护方面效率低下。因此,提出的研究计划的目标是开发一套新的协议和编码方案,以支持新一代通用和可更新的编码分布式存储系统。第2部分:基于研究人员的初步工作,本提案旨在为编码同步和重复数据删除的新领域奠定基础,目标是推导基本的性能限制,为这两类问题开发有效的算法解决方案,并构建新的分布式存储代码,使编码数据同步和编码重复数据删除成为可能。特别是,该提案解决了以下综合问题:1)描述了已知和新的(非)编码同步方案的通信速率限制,不同结构化或编码数据格式和不同类型的通信通道的重复数据删除和数据修复性能之间的权衡。2)介绍并分析了用于结构化/编码数据的近似同步和重复数据删除的通信速率失真(CRD)功能,特别关注延迟敏感应用。3)在图像和视频数据编码中,根据网络拓扑和用户不同的优先级需求,开发可动态更新的同步和重复数据删除算法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Salim El Rouayheb其他文献

Salim El Rouayheb的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Salim El Rouayheb', 18)}}的其他基金

RINGS: Walk For Resiliency & Privacy: A Random Walk Framework for Learning at the Edge
RINGS:步行以增强弹性
  • 批准号:
    2148182
  • 财政年份:
    2022
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Collaborative: Secure Distributed Coded Computations for IoT: An Information Theoretic and Network Approach
SaTC:核心:媒介:协作:物联网的安全分布式编码计算:信息论和网络方法
  • 批准号:
    1801630
  • 财政年份:
    2018
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
CAREER:Information Theoretic Methods for Private Information Retrieval and Search in Distributed Storage Systems
职业:分布式存储系统中隐私信息检索和搜索的信息论方法
  • 批准号:
    1817635
  • 财政年份:
    2017
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Continuing Grant
CAREER:Information Theoretic Methods for Private Information Retrieval and Search in Distributed Storage Systems
职业:分布式存储系统中隐私信息检索和搜索的信息论方法
  • 批准号:
    1652867
  • 财政年份:
    2017
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms
CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法
  • 批准号:
    1526962
  • 财政年份:
    2015
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Designing Plotkin Transform Codes via Machine Learning
协作研究:CIF:小型:通过机器学习设计 Plotkin 转换代码
  • 批准号:
    2312753
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Hypergraph Signal Processing and Networks via t-Product Decompositions
合作研究:CIF:小型:通过 t 产品分解的超图信号处理和网络
  • 批准号:
    2230161
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312871
  • 财政年份:
    2023
  • 资助金额:
    $ 7.98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了