CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms

CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法

基本信息

项目摘要

Part 1: Coding for distributed storage systems has garnered significant attention in the past few years due to the rapid development of information technologies and the emergence of Big Data formats that need to be stored and disseminated across large-scale networks. As typical distributed systems need to ensure low-latency data access and store a large number of files over a set of nodes connected through a communication network, it is imperative to develop new distributed coding schemes that protect the systems from undesired component failures. The two key functionalities of codes used in distributed systems, namely the reconstruction of files via access to a subset of the nodes and repair of failed nodes, need to be retained when the files are accessed and processed by the users via symbol/block insertion, deletion, or substitution edits. Deletions frequently arise due to system-level data deduplication: when parts of files are deduplicated or edited, the changes in the information content need to be communicated to the redundant storage nodes with minimum communication cost. Current solutions for synchronizing data that underwent edits assume that data is uncoded and they do not fully exploit the distributed nature of information. Furthermore, they mostly ignore the presence of deduplication protocols. This makes distributed storage architectures inefficient in terms of storage, user access times, and error protection. Hence, the goals of the proposed research program are to develop a new set of protocols and coding schemes that will support a new generation of versatile and updatable coded distributed storage systems. Part 2: Building on the preliminary work of the investigators, this proposal aims to set the foundations of the new field of coded synchronization and deduplication, with the goal of deriving fundamental performance limits, developing efficient algorithmic solutions for the two families of problems, and constructing new distributed storage codes that enable synchronization of coded data and coded deduplication. In particular, the proposal addresses the following comprehensive issues: 1) Characterizing the communication rate limits of known and new (un)coded synchronization schemes, trade-offs between deduplication and data repair performance for different structured or encoded data formats and different types of communication channels.2) Introducing and analyzing the communication rate-distortion (CRD) function for approximate synchronization and deduplication of structured/encoded data, with a special focus on delay-sensitive applications.3) Developing dynamically updatable synchronization and deduplication algorithms cognizant of the network topology and of different prioritization needs of the users, as encountered in image and video data coding.
第一部分:在过去的几年中,由于信息技术的快速发展以及需要在大规模网络中存储和传播的大数据格式的出现,分布式存储系统的编码已经引起了人们的极大关注。由于典型的分布式系统需要确保低延迟的数据访问和存储大量的文件通过一组节点连接通过通信网络,它是必要的,以保护系统不受不希望的组件故障的新的分布式编码方案。在分布式系统中使用的代码的两个关键功能,即通过访问节点的子集和修复故障节点来重建文件,需要在用户通过符号/块插入、删除或替换编辑来访问和处理文件时保留。由于系统级重复数据删除,删除经常出现:当部分文件被删除或编辑时,信息内容的更改需要以最小的通信成本传送到冗余存储节点。用于同步经历编辑的数据的当前解决方案假定数据是未编码的,并且它们没有充分利用信息的分布式性质。此外,它们大多忽略了重复数据删除协议的存在。这使得分布式存储架构在存储、用户访问时间和错误保护方面效率低下。因此,拟议的研究计划的目标是开发一套新的协议和编码方案,将支持新一代的通用和可更新的编码分布式存储系统。第二部分:在调查人员初步工作的基础上,该提案旨在为编码同步和重复数据删除的新领域奠定基础,其目标是获得基本性能限制,为两个问题家族开发有效的算法解决方案,并构建新的分布式存储代码,使编码数据和编码重复数据删除同步。该提案特别涉及以下综合问题:1)表征已知和新的(未)编码同步方案的通信速率极限,针对不同的结构化或编码数据格式以及不同类型的通信信道,在重复数据删除和数据修复性能之间进行权衡。2)介绍并分析用于结构化/编码数据格式的近似同步和重复数据删除的通信速率失真(CRD)函数,3)开发动态可更新的同步和重复数据删除算法,该算法认识到网络拓扑和用户的不同优先级需求,如在图像和视频数据编码中遇到的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Olgica Milenkovic其他文献

On the generalized Hamming weight enumerators and coset weight distributions of even isodual codes
关于偶等对码的广义汉明权重枚举器和陪集权重分布
Detection and Mapping of dsDNA Breaks using Graphene Nanopore Transistor
  • DOI:
    10.1016/j.bpj.2018.11.1580
  • 发表时间:
    2019-02-15
  • 期刊:
  • 影响因子:
  • 作者:
    Nagendra Athreya;Olgica Milenkovic;Jean-Pierre Leburton
  • 通讯作者:
    Jean-Pierre Leburton
Query-based selection of optimal candidates under the Mallows model
  • DOI:
    10.1016/j.tcs.2023.114206
  • 发表时间:
    2023-11-10
  • 期刊:
  • 影响因子:
  • 作者:
    Xujun Liu;Olgica Milenkovic;George V. Moustakides
  • 通讯作者:
    George V. Moustakides

Olgica Milenkovic的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Olgica Milenkovic', 18)}}的其他基金

Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402815
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Group testing for Real-Time Polymerase Chain Reactions: From Primer Selection to Amplification Curve Analysis
合作研究:CIF:中:实时聚合酶链式反应的分组测试:从引物选择到扩增曲线分析
  • 批准号:
    2107344
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage
合作研究:CIF:小型:分子存储中的编码串重建问题
  • 批准号:
    2008125
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: New Methods for Learning on Hypergraphs for Single-Cell Chromatin Data Analysis
合作研究:CIF:Medium:用于单细胞染色质数据分析的超图学习新方法
  • 批准号:
    1956384
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research:Leveraging Data Popularity in Distributed Storage Systems via Constrained Design Theory
CIF:小型:协作研究:通过约束设计理论利用分布式存储系统中的数据流行度
  • 批准号:
    1816913
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SemiSynBio: An On-Chip Nanoscale Storage System Using Chimeric DNA
SemiSynBio:使用嵌合 DNA 的片上纳米级存储系统
  • 批准号:
    1807526
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CIF: Small: Coding for DNA-Based Storage Systems
CIF:小型:基于 DNA 的存储系统的编码
  • 批准号:
    1618366
  • 财政年份:
    2016
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
  • 批准号:
    1527636
  • 财政年份:
    2015
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: A General Theory of Group Testing for Genotyping
CIF:小型:协作研究:基因分型群体测试的一般理论
  • 批准号:
    1218764
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CIF: Small: Nonlinear Matrix and Tensor Completion with Applications in Systems Biology
CIF:小:非线性矩阵和张量补全及其在系统生物学中的应用
  • 批准号:
    1117980
  • 财政年份:
    2011
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

针刺协同化疗联合免疫检查点抑制剂治疗EGFR突变阳性晚期NSCLC的多中心随机对照临床研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
紫草素通过METTL3/RBM15调控STING的m6A修饰协同PD-1抑制剂抗非小细胞肺癌免疫耐药的作用和机制研究
  • 批准号:
    MS25H280040
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多模态遥感数据信息协同的海上小目标 识别方法研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
“ 一老一小”服务联合体体制机制创新研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于大-小模型融合的多智能体自适应导学关键技术研究
  • 批准号:
    JCZRQN202500516
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
SNHG17通过双重机制协同调控Hippo/YAP信号促进非小细胞肺癌恶性进展的作用及机制研究
  • 批准号:
    MS25H160123
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
可编程的智能响应型“DNA纳米机器人”核酸自组装递释系统用于小激活RNA疗法和化疗协同抗肿瘤
  • 批准号:
    2024Y9099
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
江汉平原小微湿地功能优化提升多元协同技术研究与应用
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
小微企业金融科技借贷的产品创新与普惠机理:票税数据与传统征信的数据协同视角
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    青年科学基金项目
血管穿透肽功能化外泌体介导眼铂和PD-L1抑制剂递送对非小细胞肺癌的协同治疗
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Designing Plotkin Transform Codes via Machine Learning
协作研究:CIF:小型:通过机器学习设计 Plotkin 转换代码
  • 批准号:
    2312753
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Hypergraph Signal Processing and Networks via t-Product Decompositions
合作研究:CIF:小型:通过 t 产品分解的超图信号处理和网络
  • 批准号:
    2230161
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312871
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了