CIF: Small: Fundamental Limits of DNA-Based Storage
CIF:小:基于 DNA 的存储的基本限制
基本信息
- 批准号:2007597
- 负责人:
- 金额:$ 48.41万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-07-01 至 2024-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The demand for data storage continues to increase at a rapid pace, posing significant challenges to current data centers and spurring significant interest in the development of new storage technologies. DNA, the molecule that carries the genetic information of all living matter, has become a promising medium for long-term archival data storage due to its longevity and very high information density. This new approach to data storage presents unique challenges. Unlike typical hard drives, where data bits are stored in a well-ordered linear fashion, storing data on DNA requires the synthesis of a large number of DNA molecules that are then mixed out of order in a liquid solution. This makes the process of reliably reading the data after storage significantly more expensive and computationally complex. The goal of this project is to understand the fundamental limitations and capabilities of DNA as a storage medium. In particular, this research seeks to characterize basic tradeoffs between cost, information density, reading and writing speeds, and reliability, aiming to develop new coding strategies that can unlock the full potential of this innovative approach to data storage.The project will investigate the fundamental limits of DNA storage systems by focusing on three main objectives. The first objective is to develop an information theory framework to formally analyze these systems. DNA storage systems will be modeled via the abstraction of a shuffling channel, which captures the fact that, in DNA-based storage, many blocks of data are shuffled out of order. The capacity of these channels will be characterized under different noise models and properties of optimal coding schemes will be studied. A particular question of interest is how to design capacity-optimal indexing strategies that allow the proper reordering of the data. Since the cost of synthesizing long DNA strands is the main obstacle to practical DNA storage, the second research objective will deal with systems that store data on many very short DNA strands, each of which is too short to encode any meaningful information. For that reason, new strategies to encode information in the concentration of different DNA molecules in the solution will be proposed, and their fundamental capabilities established. The third research objective will focus on the computational challenges associated with the joint processing of a large set of DNA sequences. In particular, basic tradeoffs between storage capacity and computational requirements will be established, and recent algorithmic advances in large-scale sequence alignment will be leveraged towards the development of computationally efficient decoding algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
对数据存储的需求持续快速增长,给当前的数据中心带来了重大挑战,并激发了人们对新存储技术开发的极大兴趣。DNA是携带所有生物遗传信息的分子,由于其寿命长和信息密度高,已成为长期档案数据存储的有前途的介质。这种新的数据存储方法带来了独特的挑战。与典型的硬盘驱动器不同,数据位以有序的线性方式存储,在DNA上存储数据需要合成大量的DNA分子,然后在液体溶液中无序混合。这使得在存储之后可靠地阅读数据的过程明显更昂贵并且计算复杂。该项目的目标是了解DNA作为存储介质的基本限制和能力。特别是,本研究旨在描述成本、信息密度、阅读和写入速度以及可靠性之间的基本权衡,旨在开发新的编码策略,以释放这种创新方法的全部潜力。该项目将通过关注三个主要目标来调查DNA存储系统的基本限制。第一个目标是开发一个信息理论框架来正式分析这些系统。DNA存储系统将通过洗牌通道的抽象来建模,该通道捕获了这样一个事实,即在基于DNA的存储中,许多数据块被打乱顺序。这些信道的容量将根据不同的噪声模型和性能的最佳编码方案进行了研究。一个特别令人感兴趣的问题是如何设计容量最佳的索引策略,使数据的适当重新排序。由于合成长DNA链的成本是实际DNA存储的主要障碍,第二个研究目标将处理在许多非常短的DNA链上存储数据的系统,每个DNA链都太短,无法编码任何有意义的信息。因此,将提出在溶液中不同DNA分子的浓度中编码信息的新策略,并建立其基本能力。第三个研究目标将集中在与联合处理大量DNA序列相关的计算挑战。特别是,将建立存储容量和计算要求之间的基本权衡,以及最近在大规模序列比对算法的进步将被利用对计算效率的解码algorithm.This奖项反映了NSF的法定使命的发展,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Torn-Paper Coding
撕纸编码
- DOI:10.1109/tit.2021.3120920
- 发表时间:2021
- 期刊:
- 影响因子:2.5
- 作者:Shomorony, Ilan;Vahid, Alireza
- 通讯作者:Vahid, Alireza
Fundamental Limits of Multiple Sequence Reconstruction from Substrings
- DOI:10.1109/isit54713.2023.10206707
- 发表时间:2023-05
- 期刊:
- 影响因子:0
- 作者:Kelly Levick;Ilan Shomorony
- 通讯作者:Kelly Levick;Ilan Shomorony
Achieving the Capacity of a DNA Storage Channel with Linear Coding Schemes
利用线性编码方案实现 DNA 存储通道的容量
- DOI:10.1109/ciss53076.2022.9751151
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Levick, Kel;Heckel, Reinhard;Shomorony, Ilan
- 通讯作者:Shomorony, Ilan
Coded Shotgun Sequencing
编码鸟枪测序
- DOI:10.1109/jsait.2022.3151737
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Ravi, Aditya Narayan;Vahid, Alireza;Shomorony, Ilan
- 通讯作者:Shomorony, Ilan
Information-Theoretic Foundations of DNA Data Storage
DNA 数据存储的信息论基础
- DOI:10.1561/0100000117
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Shomorony, Ilan;Heckel, Reinhard
- 通讯作者:Heckel, Reinhard
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ilan Shomorony其他文献
Capacity Results for the Noisy Shuffling Channel
噪声洗牌通道的容量结果
- DOI:
10.1109/isit.2019.8849789 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Ilan Shomorony;Reinhard Heckel - 通讯作者:
Reinhard Heckel
Computing Half-Duplex Schedules in Gaussian Relay Networks via Min-Cut Approximations
通过最小割近似计算高斯中继网络中的半双工调度
- DOI:
10.1109/tit.2014.2359440 - 发表时间:
2014 - 期刊:
- 影响因子:2.5
- 作者:
R. Etkin;F. Parvaresh;Ilan Shomorony;A. Avestimehr - 通讯作者:
A. Avestimehr
Fast multiple sequence alignment via multi-armed bandits
通过多臂老虎机进行快速多序列比对
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:5.8
- 作者:
Kayvon Mazooji;Ilan Shomorony - 通讯作者:
Ilan Shomorony
Unsupervised integration of multimodal dataset identifies novel signatures of health and disease
多模式数据集的无监督整合识别了健康和疾病的新特征
- DOI:
10.1101/432641 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Ilan Shomorony;E. Cirulli;Lei Huang;Lori A. Napier;Robyn R. Heister;Michael A. Hicks;Isaac V. Cohen;Hung;C. Swisher;Natalie M. Schenker;Weizhong Li;A. Kahn;Timothy D. Spector;C. Caskey;J. Venter;D. Karow;E. Kirkness;N. Shah - 通讯作者:
N. Shah
An Information Theory for Out-of-Order Media With Applications in DNA Data Storage
无序媒体信息论及其在 DNA 数据存储中的应用
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:2.2
- 作者:
Aditya Narayan Ravi;Alireza Vahid;Ilan Shomorony - 通讯作者:
Ilan Shomorony
Ilan Shomorony的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ilan Shomorony', 18)}}的其他基金
CAREER: Genomic Data Science: From Informational Limits to Efficient Algorithms
职业:基因组数据科学:从信息限制到高效算法
- 批准号:
2046991 - 财政年份:2021
- 资助金额:
$ 48.41万 - 项目类别:
Continuing Grant
相似国自然基金
小胶质细胞通过FABP5/LXR/SREBP1轴介导的吞噬功能障碍加剧阿尔茨海默病Aβ病理的机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于多重时序液滴数字CRISPR的肺癌单个小细胞外囊泡miRNAs多靶标灵敏检测新方法研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
复制蛋白A小分子抑制剂-HAMNO调控DNA损伤修复的结构及功能研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
肠上皮细胞TET2/AHR/NLRP3轴经“脑肠通讯”激活mPFC小胶质细胞导致抑郁样行为的机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
CD200-CD200R轴调控小胶质细胞Mrp8/14释放介导抑郁症发病的作用机
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
补体C3依赖的小胶质细胞突触异常修剪介导幼龄小鼠纳米氧化铝颗粒暴露致自闭症样行为发生的机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
智护到家——肝癌口服靶向药物患者依从行为智能预测与管理微信小程序设计和实现
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于小目标检测与DeepSeek大模型的智能医学检测及诊疗研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于点击化学“靶标垂钓”探究小檗碱主要代谢产物-小檗红碱激活“MAPK/cPLA2通路”致肾脏毒性的分子机制
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于小RNA深度测序鉴定重庆地区药用植物病毒病原
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
Collaborative Research: CIF: Small: Approximate Coded Computing - Fundamental Limits of Precision, Fault-Tolerance, and Privacy
协作研究:CIF:小型:近似编码计算 - 精度、容错性和隐私的基本限制
- 批准号:
2231706 - 财政年份:2023
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Approximate Coded Computing - Fundamental Limits of Precision, Fault-tolerance and Privacy
协作研究:CIF:小型:近似编码计算 - 精度、容错性和隐私的基本限制
- 批准号:
2231707 - 财政年份:2023
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Fundamental Communication Latency Limits Beyond the Traditional Block-Coding Architecture
CIF:小:超越传统块编码架构的基本通信延迟限制
- 批准号:
2309887 - 财政年份:2023
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Generic Building Blocks of Communication-efficient Computation Networks - Fundamental Limits
CIF:小型:通信高效计算网络的通用构建块 - 基本限制
- 批准号:
2221379 - 财政年份:2023
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Fundamental limits in ambiguous communication
CIF:小:模糊沟通的基本限制
- 批准号:
2115071 - 财政年份:2021
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Communication, Storage, Complexity, and Security: A Holistic View on the Fundamental Limits and Code Designs for Private Information Retrieval
合作研究:CIF:小型:通信、存储、复杂性和安全性:私人信息检索的基本限制和代码设计的整体观点
- 批准号:
2007108 - 财政年份:2020
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Fundamental Limits of Empirical Risk Minimization in High Dimensions: A Unifying Gaussian Processes Approach
CIF:小:高维经验风险最小化的基本限制:统一高斯过程方法
- 批准号:
2009030 - 财政年份:2020
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Learning and estimation with rough non-convex objectives: Fundamental limits and efficient algorithms
CIF:小:具有粗略非凸目标的学习和估计:基本限制和高效算法
- 批准号:
2006489 - 财政年份:2020
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Communication, Storage, Complexity, and Security: A Holistic View on the Fundamental Limits and Code Designs for Private Information Retrieval
合作研究:CIF:小型:通信、存储、复杂性和安全性:对私人信息检索的基本限制和代码设计的整体看法
- 批准号:
2007067 - 财政年份:2020
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant
CIF: Small: Fundamental Tradeoffs Between Communication Load and Storage Resources in Distributed systems
CIF:小:分布式系统中通信负载和存储资源之间的基本权衡
- 批准号:
1910309 - 财政年份:2019
- 资助金额:
$ 48.41万 - 项目类别:
Standard Grant