Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage

合作研究:CIF:小型:分子存储中的编码串重建问题

基本信息

  • 批准号:
    2007238
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

The problem of reconstructing text strings from their fragments or masses of fragments is of focal importance in computational biology as current DNA and protein sequencing platforms are unable to read the content of long strings that denote protein/gene sequences. One prototypical example of string reconstruction arises in DNA assembly: there, one creates multiple copies of the same long string and cuts the copies to read out short overlapping substrings that can be put together by matching their prefixes and suffixes. The reconstructed string may not be a perfect replica of the original string due to errors in the fragmentation and matching processes. Furthermore, for many strings unique reconstruction is inherently impossible. This represents a major issue for next generation sequencing technologies used in fundamental biological research, since in this setting it is impossible to ensure unambiguous results. The successful code designs pursued in this project can resolve reliability and content retrieval issues impeding implementations of emerging molecular computing and storage paradigms. This project is concerned with developing novel coding methods for unique reconstruction of strings or pools of strings based on their constituent substrings, subsequences and substring compositions. The techniques employed represent a combination of new graph-theoretic, combinatorial optimization and information theory approaches. In particular, the project will investigate the use of balanced partial de Bruijn strings for substring-based reconstruction, Catalan-like paths for multiset composition reconstruction as well as coded multi-trace reconstruction methods involving specialized modifications of deletion-correcting codes and superposition codes. The coding schemes will be tested on DNA-based and synthetic polymer-based data storage platforms under the development at the University of Illinois.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
从它们的片段或大量片段重建文本串的问题在计算生物学中具有焦点重要性,因为当前的DNA和蛋白质测序平台无法读取表示蛋白质/基因序列的长串的内容。一个典型的字符串重构的例子出现在DNA组装中:在那里,一个人创建了同一个长字符串的多个副本,并切割副本以读出短的重叠子串,这些子串可以通过匹配它们的前缀和后缀放在一起。由于分段和匹配过程中的错误,重建的字符串可能不是原始字符串的完美副本。此外,对于许多字符串来说,唯一的重构本质上是不可能的。这代表了基础生物学研究中使用的下一代测序技术的一个主要问题,因为在这种情况下,不可能确保明确的结果。在这个项目中追求的成功的代码设计可以解决阻碍新兴分子计算和存储范例实现的可靠性和内容检索问题。这个项目关注的是开发新的编码方法,用于基于其组成子串、连续性和子串组成来唯一地重建串或串池。所采用的技术代表了新的图论,组合优化和信息理论方法的组合。特别是,该项目将研究使用平衡的部分de Bruijn字符串进行基于子串的重建,用于多集组合重建的Catalan类路径以及涉及删除校正码和叠加码的专门修改的编码多迹重建方法。编码方案将在伊利诺伊大学开发的基于DNA和合成聚合物的数据存储平台上进行测试。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wojciech Szpankowski其他文献

Project-Team Hipercom HIgh PERformance COMmunication
Hipercom 高性能通信项目团队
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philippe Jacquet;Wojciech Szpankowski;C. Adjih;Géraud Allard;E. Baccelli;P. Mühlethaler
  • 通讯作者:
    P. Mühlethaler
Average redundancy rate of the Lempel-Ziv code
Lempel-Ziv码的平均冗余率
Profiles of PATRICIA Tries
  • DOI:
    10.1007/s00453-016-0261-5
  • 发表时间:
    2016-12-07
  • 期刊:
  • 影响因子:
    0.700
  • 作者:
    Abram Magner;Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski
Combinatorial optimization problems for which almost every algorithm is asymptotically optimal
几乎所有算法都是渐近最优的组合优化问题
  • DOI:
  • 发表时间:
    1995
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski
An analysis of a contention resolution algorithm
  • DOI:
    10.1007/bf00264363
  • 发表时间:
    1987-04-01
  • 期刊:
  • 影响因子:
    0.500
  • 作者:
    Wojciech Szpankowski
  • 通讯作者:
    Wojciech Szpankowski

Wojciech Szpankowski的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wojciech Szpankowski', 18)}}的其他基金

CCF: Medium: Learning From Classical and Quantum Data: a Fourier Perspective
CCF:媒介:从经典和量子数据中学习:傅里叶视角
  • 批准号:
    2211423
  • 财政年份:
    2022
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF:Small: Towards Information Content of Dynamic Structures
CIF:Small:走向动态结构的信息内容
  • 批准号:
    2006440
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Towards Structural Information
CIF:小:走向结构信息
  • 批准号:
    1524312
  • 财政年份:
    2015
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Emerging Frontiers of Science of Information
信息科学的新兴前沿
  • 批准号:
    0939370
  • 财政年份:
    2010
  • 资助金额:
    $ 25万
  • 项目类别:
    Cooperative Agreement
Collaborative Research: Information Theory of Data Structures
合作研究:数据结构信息论
  • 批准号:
    0830140
  • 财政年份:
    2008
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Information Transfer in Biological Systems
生物系统中的信息传输
  • 批准号:
    0800568
  • 财政年份:
    2008
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: Nonlinear Equations Arising in Information Theory and Computer Sciences
合作研究:信息论和计算机科学中出现的非线性方程
  • 批准号:
    0503742
  • 财政年份:
    2005
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Crossroads of Information Theory and Computer Science: Analytic Algorithmics, Combinatorics, and Information Theory
信息论和计算机科学的十字路口:分析算法、组合学和信息论
  • 批准号:
    0513636
  • 财政年份:
    2005
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Information Theory and Computer Science Interface
信息论与计算机科学接口
  • 批准号:
    0321451
  • 财政年份:
    2003
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Analytic Information Theory, Combinatorics, and Algorithmics: The Precise Redundancy and Related Problems
分析信息论、组合学和算法:精确冗余及相关问题
  • 批准号:
    0208709
  • 财政年份:
    2002
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
  • 批准号:
    2403122
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402815
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402817
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402816
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
  • 批准号:
    2403123
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了