Design, analysis, development and experimental validation of algorithms for high throughput sequencing mass data using the SeqAn library for biological sequence analysis

使用 SeqAn 库进行生物序列分析的高通量测序海量数据算法的设计、分析、开发和实验验证

基本信息

项目摘要

During the last five years modern sequencing technologies have brought a super-exponential growth of sequencing capacities. At the time of writing this proposal it is possible to sequence about 30 billion nucleotides per day using one sequencing machine. This proposal aims to respond to the described increase of genomic sequence data with algorithmic approaches that benefit from redundancies across multiple datasets. More specifically we aim at: 1) Developing a data structure representing one or more genomic sequences by storing only the differences to a similar reference sequence while maintaining the ability to navigate quickly in all sequences. We then us this data structure for developing algorithms to transform the substring index data structure of a reference to the substring index of a new genome without rebuilding it from scratch and by only storing the differences to the reference index. 2) Developing algorithms that efficiently process multiple genomes in parallel based on the representation developed in 1). 3) Bridging the gap between algorithm theory and practical implementations by extending SeqAn as a library providing the core algorithmic components required to analyze large-scale genomic data and as an experimental platform to design, analyze, and implement state-of-the-art bioinformatics algorithms.
在过去的五年中,现代测序技术带来了测序能力的超指数增长。在撰写本提案时,使用一台测序机每天可以测序约300亿个核苷酸。该提案旨在通过受益于多个数据集之间的冗余的算法方法来响应所描述的基因组序列数据的增加。更具体地说,我们的目标是:1)通过仅存储与相似参考序列的差异,同时保持在所有序列中快速导航的能力,开发表示一个或多个基因组序列的数据结构。然后,我们使用该数据结构来开发算法,以将参考的子串索引数据结构转换为新基因组的子串索引,而无需从头开始重建它,并且仅将差异存储到参考索引。2)开发算法,有效地处理多个基因组在1)的基础上开发的表示并行。3)通过扩展SeqAn作为一个库,提供分析大规模基因组数据所需的核心算法组件,并作为一个实验平台,设计,分析和实现最先进的生物信息学算法,弥合算法理论和实际实现之间的差距。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr. Knut Reinert其他文献

Professor Dr. Knut Reinert的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr. Knut Reinert', 18)}}的其他基金

Design, analysis, development and experimental validation of genome comparison algorithms using the SeqAn library
使用 SeqAn 库设计、分析、开发和实验验证基因组比较算法
  • 批准号:
    149054717
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Intelligent Patent Analysis for Optimized Technology Stack Selection:Blockchain BusinessRegistry Case Demonstration
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
利用全基因组关联分析和QTL-seq发掘花生白绢病抗性分子标记
  • 批准号:
    31971981
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
基于SERS纳米标签和光子晶体的单细胞Western Blot定量分析技术研究
  • 批准号:
    31900571
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
利用多个实验群体解析猪保幼带形成及其自然消褪的遗传机制
  • 批准号:
    31972542
  • 批准年份:
    2019
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
基于Meta-analysis的新疆棉花灌水增产模型研究
  • 批准号:
    41601604
  • 批准年份:
    2016
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究
  • 批准号:
    61502059
  • 批准年份:
    2015
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
多目标诉求下我国交通节能减排市场导向的政策组合选择研究
  • 批准号:
    71473155
  • 批准年份:
    2014
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
大规模微阵列数据组的meta-analysis方法研究
  • 批准号:
    31100958
  • 批准年份:
    2011
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于物质流分析的中国石油资源流动过程及碳效应研究
  • 批准号:
    41101116
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Computer-aided design and development of isoform selective inhibitors of Casein Kinase 1
酪蛋白激酶 1 异构体选择性抑制剂的计算机辅助设计和开发
  • 批准号:
    10629703
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Anti-flavivirus B cell response analysis to aid vaccine design
抗黄病毒 B 细胞反应分析有助于疫苗设计
  • 批准号:
    10636329
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Design and synthesis of a next generation glycobiology toolbox for cell surface labeling
用于细胞表面标记的下一代糖生物学工具箱的设计和合成
  • 批准号:
    10699270
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Improving the design and statistical analysis of cluster-randomized trials on tropical infectious diseases
改进热带传染病整群随机试验的设计和统计分析
  • 批准号:
    10570440
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Matched Design with Sensitivity Analysis for Observational Survival Data in Cardiovascular Patient Management using EMR Data
使用 EMR 数据对心血管患者管理中的观察性生存数据进行匹配设计和敏感性分析
  • 批准号:
    10731172
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Structure-guided design of protease-resistant, lipopeptide inhibitors of SARS-CoV-2
SARS-CoV-2 蛋白酶抗性脂肽抑制剂的结构指导设计
  • 批准号:
    10679139
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Immunoprofiling of Opioid Use Disorder Patients to inform structure-guided design of opioid-specific monoclonal antibodies
阿片类药物使用障碍患者的免疫分析可为阿片类药物特异性单克隆抗体的结构指导设计提供信息
  • 批准号:
    10751233
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Human-centered design of clinical AI to support the diagnosis of pediatric suprasellar tumors
以人为本的临床人工智能设计支持小儿鞍上肿瘤的诊断
  • 批准号:
    10750837
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Decoding Viral Control of Host Kinase Signaling to Design Combination Therapy
解码病毒对宿主激酶信号传导的控制以设计联合疗法
  • 批准号:
    10449933
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
A multidisciplinary BCC for ovarian cancer early detection: translating discoveries to clinical use with a by-design approach
用于卵巢癌早期检测的多学科 BCC:通过设计方法将发现转化为临床应用
  • 批准号:
    10673186
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了