Computational methods for variant calling and haplotyping using long-read sequencing technologies

使用长读长测序技术进行变异调用和单倍型分析的计算方法

基本信息

  • 批准号:
    10441522
  • 负责人:
  • 金额:
    $ 38.16万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-09-01 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

Project Summary/Abstract In this project, we propose to develop computational methods and tools for whole-genome haplotyping and small variant calling using long-read sequencing technologies such as Pacific Biosciences and Oxford Nanopore and linked-read technologies. Haplotype information is crucial for interpretation of genetic variation in individual genomes, disease mapping, clinical genomics and several other analysis of human genetic variation. The lack of phase or haplotype information in human genomes sequenced using short reads is a major barrier in identifying disease associations with compound heterozygous mutations. More than 600 genes overlap segmental duplications with high sequence identity and variants in more than 100 such genes have been associated with rare Mendelian disorders and complex diseases including cancer. The inability to detect variants with high accuracy in duplicated regions of the genome using short-read sequencing technologies reduces the ability to identify disease causing mutations in medical genetics studies. In Aim 1, we will develop a general computational method for long-read based diploid genotyping that will enable accurate haplotyping for single nucleotide variants and short indels using long-read and linked-reads as well as accurate small variant calling using SMS technologies. In Aim 2, we will develop computational methods for sensitive mapping of SMS reads and accurate variant calling in repetitive regions of the human genome that are currently excluded from benchmark small variant call sets for reference human genomes. Finally, in Aim 3, we will leverage the methods from Aims 1 and 2 to perform variant calling on multiple genomes sequenced using SMS technologies to catalog variant PSVs and leverage this catalog to improve read mapping and variant calling accuracy of short-read sequencing in repetitive regions of the genome. We will implement the methods in robust and computationally efficient software tools and benchmark their accuracy using publicly available long- read sequence datasets for multiple human genomes of diverse ancestries.
项目总结/摘要 在这个项目中,我们建议开发全基因组单体型分析的计算方法和工具, 使用长读序测序技术(如Pacific Biosciences和Oxford)的小变异识别 纳米孔和链接读取技术。单倍型信息是解释遗传变异的关键 在个体基因组、疾病图谱、临床基因组学和人类遗传学的其他几种分析中, 变化量在使用短读段测序的人类基因组中缺乏相位或单体型信息是一个潜在的问题。 在确定疾病与复合杂合突变的关系方面存在主要障碍。600多个基因 在100多个这样的基因中具有高序列同一性的重叠片段重复和变体, 与罕见的孟德尔疾病和包括癌症在内的复杂疾病有关。无法检测 使用短读测序技术在基因组重复区域中具有高准确性的变体 降低了在医学遗传学研究中识别致病突变的能力。在目标1中,我们将开发 一种基于长读段的二倍体基因分型的通用计算方法, 对于单核苷酸变体和短插入缺失,使用长读段和连接读段以及精确的小插入缺失, 使用SMS技术的变体呼叫。在目标2中,我们将开发敏感映射的计算方法 的SMS读取和准确的变异呼叫在人类基因组的重复区域,目前是 从参考人类基因组的基准小变异调用集合中排除。在目标3中,我们将 利用目标1和2中的方法,对使用SMS测序的多个基因组进行变异识别 技术来对变体PSV进行编目,并利用该编目来改进读段映射和变体调用 在基因组的重复区域中短读测序的准确性。我们将在 强大和计算效率高的软件工具,并使用公开的长期可用的基准, 读取不同祖先的多个人类基因组的序列数据集。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Vikas Bansal其他文献

Vikas Bansal的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Vikas Bansal', 18)}}的其他基金

Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
  • 批准号:
    10657420
  • 财政年份:
    2020
  • 资助金额:
    $ 38.16万
  • 项目类别:
Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
  • 批准号:
    10058104
  • 财政年份:
    2020
  • 资助金额:
    $ 38.16万
  • 项目类别:
Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
  • 批准号:
    10247821
  • 财政年份:
    2020
  • 资助金额:
    $ 38.16万
  • 项目类别:
Methods for detecting short indels from high-throughput sequence data
从高通量序列数据中检测短插入缺失的方法
  • 批准号:
    8706938
  • 财政年份:
    2013
  • 资助金额:
    $ 38.16万
  • 项目类别:
Methods for detecting short indels from high-throughput sequence data
从高通量序列数据中检测短插入缺失的方法
  • 批准号:
    8572023
  • 财政年份:
    2013
  • 资助金额:
    $ 38.16万
  • 项目类别:

相似海外基金

CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
  • 批准号:
    2337776
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Continuing Grant
CAREER: From Dynamic Algorithms to Fast Optimization and Back
职业:从动态算法到快速优化并返回
  • 批准号:
    2338816
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Continuing Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
  • 批准号:
    2338846
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Continuing Grant
CRII: SaTC: Reliable Hardware Architectures Against Side-Channel Attacks for Post-Quantum Cryptographic Algorithms
CRII:SaTC:针对后量子密码算法的侧通道攻击的可靠硬件架构
  • 批准号:
    2348261
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
  • 批准号:
    2348346
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
  • 批准号:
    2348457
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Standard Grant
EAGER: Search-Accelerated Markov Chain Monte Carlo Algorithms for Bayesian Neural Networks and Trillion-Dimensional Problems
EAGER:贝叶斯神经网络和万亿维问题的搜索加速马尔可夫链蒙特卡罗算法
  • 批准号:
    2404989
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Standard Grant
CAREER: Efficient Algorithms for Modern Computer Architecture
职业:现代计算机架构的高效算法
  • 批准号:
    2339310
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Continuing Grant
CAREER: Improving Real-world Performance of AI Biosignal Algorithms
职业:提高人工智能生物信号算法的实际性能
  • 批准号:
    2339669
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Continuing Grant
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 38.16万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了