III: Small: Genome-Wide Algorithms for Haplotype Reconstruction and Beyond: A Combined Haplotype Assembly and Identical-by-Descent Tracts Approach
III:小:用于单倍型重建及其他的全基因组算法:单倍型组装和相同血统相结合的方法
基本信息
- 批准号:1321000
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-10-01 至 2018-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The project will develop rigorous and fast (practical) graph-theoretic genome-wide algorithms associated with genome sequence data and graphs within an integrated set of research and educational activities designed to intertwine synergistically with statistical modeling; apply these to the solution of real-world problems and long-standing computer science and mathematics questions that impact molecular biology; and make these techniques accessible to students, researchers, and practitioners in the corresponding fields. The project focuses on algorithms for haplotype reconstruction from genome sequence data of various organisms and genomes having different polyploidy number, i.e., number of haplotypes. The mammalian genomes, human included, are diploid genomes. However, the polyploidy number varies across the life spectrum from 1 (bacteria) to more than 100 (adder's-tongue fern). The HapCompass graph-theoretic framework associates genome sequencing read mappings with the genome-wide SNP data in the human genome.The HapCompass algorithm uses local optimization algorithms on the spanning tree cycle basis of HapCompass graphs for objective functions that model various measures of error correction in haplotype reconstruction. Earlier work provided a combinatorial framework for error-correction models for diploid haplotype assembly, a framework embraced by the large literature on the topic in the following decade. The fundamental case of diploid genomes and the HapCompass graph theory, data structures and algorithms set the stage for generalizations to polyploidy and integrative genome-wide haplotype reconstruction in samples of individuals that share haplotypic regions identical by descent. In addition, curriculum development is plan that covers the topics from both a computing and the user perspective. All materials and software, source code, and documentation will be available. Software will rely on the open-source model.This project intertwines computer science with statistical models and an impact in genomics and molecular biology. Faster and more accurate algorithms for diploid haplotype assembly based on multi-criteria optimization using multiple models of error correction on the spanning-tree cycle bases of compass graphs will be developed. In addition, robust generalizations of the graph theory and algorithms for polyploid genomes that permit a common algorithmic strategy are planned. The team also is developing an optimal linear time algorithm for shared IBD tract identification in the case of phased genotype data, and efficient and exact algorithms for IBD haplotype tract identification for shared IBD tracts in unphased genotype data that are linear in the number of haplotypes and subquadratic in the number of genotypes to enhance efficiency. The final product of the work will be an algorithmic framework for genome-wide haplotype reconstruction created by combining the new algorithms and Clark Consistency Graph data structures and algorithms.
该项目将开发与基因组序列数据和图形相关的严格和快速(实用)图论全基因组算法,这些算法集成在一套旨在与统计建模协同交织的研究和教育活动中;将这些应用于解决影响分子生物学的现实问题和长期存在的计算机科学和数学问题;并使这些技术能够为相应领域的学生、研究人员和从业人员所用。本项目重点研究从多种生物基因组序列数据和具有不同多倍体数(即单倍型数)的基因组中重建单倍型的算法。包括人类在内的哺乳动物基因组都是二倍体基因组。然而,多倍体数量在整个生命范围内变化,从1(细菌)到100多个(蛇舌蕨)。HapCompass图论框架将基因组测序读取映射与人类基因组的全基因组SNP数据联系起来。HapCompass算法使用基于HapCompass图的生成树循环的局部优化算法来实现单倍型重建中各种纠错措施的目标函数。早期的工作为二倍体单倍体组装的纠错模型提供了一个组合框架,这一框架在接下来的十年中被该主题的大量文献所接受。二倍体基因组的基本案例和HapCompass图理论、数据结构和算法为在具有相同血统的单倍型区域的个体样本中推广多倍体和整合全基因组单倍型重建奠定了基础。此外,课程开发计划涵盖了从计算和用户角度的主题。所有的材料和软件、源代码和文档都是可用的。软件将依赖于开源模式。这个项目将计算机科学与统计模型以及对基因组学和分子生物学的影响交织在一起。基于多准则优化的二倍体单倍体装配算法将在罗盘图的生成树循环基上使用多种误差校正模型。此外,图论和多倍体基因组算法的鲁棒推广,允许一个共同的算法策略被计划。该团队还正在开发一种最佳线性时间算法,用于在分阶段基因型数据的情况下识别共享IBD通道,以及用于在单倍型数量呈线性和基因型数量呈次二次的非分阶段基因型数据中识别共享IBD单倍型通道的高效精确算法,以提高效率。这项工作的最终成果将是一个全基因组单倍型重建的算法框架,该框架将结合新的算法和克拉克一致性图数据结构和算法创建。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sorin Istrail其他文献
Sorin Istrail的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sorin Istrail', 18)}}的其他基金
EAGER: Haplotype Phasing Algorithms and Clark Consistency Graphs
EAGER:单倍型定相算法和克拉克一致性图
- 批准号:
1048831 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
The Genome and the Computational Sciences, A Workshop at Brown University, December 8-12, 2008
基因组和计算科学,布朗大学研讨会,2008 年 12 月 8-12 日
- 批准号:
0714609 - 财政年份:2008
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
The cisGRN Browser and Database: cis-Regulatory Information Behind the Network
cisGRN 浏览器和数据库:网络背后的 cis 监管信息
- 批准号:
0645955 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
RUI: Structured Operational Semantics of Concurrency
RUI:并发的结构化操作语义
- 批准号:
8801174 - 财政年份:1988
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
III: Small: Improving de novo Genome Assembly using Optical Maps
III:小:使用光学图谱改进从头基因组组装
- 批准号:
1814359 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: New algorithms for genome skimming and its applications
III:小:基因组略读的新算法及其应用
- 批准号:
1815485 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Reconstructing viral population without using a reference genome
III:小:不使用参考基因组重建病毒群体
- 批准号:
1724008 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Small: Algorithms for Genome Assembly of Ultra-Deep Sequencing Data
III:小:超深度测序数据的基因组组装算法
- 批准号:
1526742 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Robust Materials Genome Data Mining Framework for Prediction and Guidance of Nanoparticle Synthesis
III:小型:协作研究:用于预测和指导纳米颗粒合成的稳健材料基因组数据挖掘框架
- 批准号:
1423056 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Robust Materials Genome Data Mining Framework for Prediction and Guidance of Nanoparticle Synthesis
III:小型:协作研究:用于预测和指导纳米颗粒合成的稳健材料基因组数据挖掘框架
- 批准号:
1423591 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Reconstructing viral population without using a reference genome
III:小:不使用参考基因组重建病毒群体
- 批准号:
1421908 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Small: Collaborative Research: Supporting Efficient Discrete Box Queries for Sequence Analysis on Large Scale Genome Databases
III:小型:协作研究:支持高效离散框查询以进行大规模基因组数据库的序列分析
- 批准号:
1319909 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Supporting Efficient Discrete Box Queries for Sequence Analysis on Large Scale Genome Databases
III:小型:协作研究:支持高效离散框查询以进行大规模基因组数据库的序列分析
- 批准号:
1320078 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Genome Assembly Using Sparse Sequence Information
III:小:使用稀疏序列信息进行基因组组装
- 批准号:
1117247 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Standard Grant