Scalable methods for identity by descent

可扩展的血统身份识别方法

基本信息

  • 批准号:
    10660800
  • 负责人:
  • 金额:
    $ 67.07万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-06-01 至 2027-06-30
  • 项目状态:
    未结题

项目摘要

Abstract In the past few years, large genotyped cohorts are getting larger. We are getting closer to the era where genotype information of a large portion of the population is available. Informatics methods are critically needed for translating the new information into insights for human genetics. Powered by informatics innovations, the landscape of IBD segment detection has been transformed in the past 3 years. In 2019, we published RaPID, the first IBD segment calling method efficient enough for biobank-scale cohorts. Afterwards, a generation of methods has been developed to offer solutions for IBD segment calling. In addition, we delivered new algorithms and methods that enriched the PBWT data structure. Also, the impacts of calling out IBD segments in large cohorts are demonstrated by the powering of precision characterization of diversity in general population cohorts, the studies of population history and human behavior, IBD-based relatedness estimate, and IBD-mapping. However, current success in identifying IBD segments from biobank-scale cohorts is only the beginning. More informatics method developments are needed to fully unleash the power of genotype information. First, current methods are mainly for longer IBD segments (greater than 3 or 5 centimorgans (cM)), and the detection power for shorter segments are insufficient. Also the accuracy is not uniformly high across all genomic regions and all populations. Second, current methods are mainly for IBD segments shared between a pair of haplotypes. With large sample sizes, multi-way IBDs are omnipresent but under-studied. Third, methods for identifying IBD segments between a query haplotype and reference panels (1-vs-n) are needed. For a small sample or even individuals, 1-vs-n query against a panel will enable powerful interpretation leveraging the rich information in the reference panel. However, current IBD segment detection methods are mainly a batch calling mode that conducts n-vs-n comparisons and thus are not flexible enough to address such needs. In this competitive renewal project, we propose to further develop efficient, accurate, and flexible algorithms for IBD segment detection for large biobank-scale data. We will improve IBD segment calling across the genome, across length-spectrum, and across ethnicities; we will develop methods for multi-way IBD cluster detection; and we will develop reference- based IBD calling and threading methods. These new informatics methods will enable the community to better leverage the genetic relationships in large genotyped cohorts for genetic discovery.
抽象的 在过去的几年中,大型基因分型人群越来越大。我们越来越接近基因型的时代 提供大部分人口的信息。信息学方法至关重要 将新信息转化为人类遗传学的见解。由信息学创新提供支持 在过去的三年中,IBD细分市场检测的景观已转化。在2019年,我们发表了Rapid, 第一个IBD段调用方法有效地有效地用于生物银行级同类。之后,一代 已经开发了用于为IBD段调用提供解决方案的方法。此外,我们提供了新算法 以及丰富PBWT数据结构的方法。此外,召集IBD段的影响很大 人群通过精确表征多样性在一般人群队中的能力来证明, 人口历史和人类行为,基于IBD的相关性估计以及IBD映射的研究。 但是,目前在识别来自生物银行级同类群体的IBD段的成功仅仅是开始。更多的 需要信息开发来完全释放基因型信息的力量。首先,最新 方法主要用于更长的IBD段(大于3或5厘米(CM)),并且检测能力 对于较短的段不足。同样,在所有基因组区域和所有基因组区域中,准确性并不均匀 人群。其次,当前方法主要用于一对单倍型之间共享的IBD段。和 大型样本量,多路IBD无处不在,但研究不足。第三,识别IBD的方法 需要查询单倍型和参考面板(1-VS-N)之间的段。对于少量样本甚至 个人,1-VS-N查询面板的查询将实现强大的解释,利用丰富的信息 参考面板。但是,当前的IBD段检测方法主要是批处理模式 进行N-VS-N比较,因此不足以满足此类需求。在这个竞争性更新中 项目,我们建议进一步开发IBD段检测的高效,准确和灵活的算法 大型生物银行规模数据。我们将改善跨基因组的IBD段,遍历长度光谱,以及 跨种族;我们将开发用于多路IBD群集检测的方法;我们将发展参考 - 基于IBD呼叫和线程方法。这些新的信息学方法将使社区能够更好 利用大基因分型队列中的遗传关系进行遗传发现。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
RAFFI: Accurate and fast familial relationship inference in large scale biobank studies using RaPID.
  • DOI:
    10.1371/journal.pgen.1009315
  • 发表时间:
    2021-01
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Naseri A;Shi J;Lin X;Zhang S;Zhi D
  • 通讯作者:
    Zhi D
Syllable-PBWT for space-efficient haplotype long-match query.
  • DOI:
    10.1093/bioinformatics/btac734
  • 发表时间:
    2023-01-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wang V;Naseri A;Zhang S;Zhi D
  • 通讯作者:
    Zhi D
RaPID-Query for fast identity by descent search and genealogical analysis.
P-smoother: efficient PBWT smoothing of large haplotype panels.
  • DOI:
    10.1093/bioadv/vbac045
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
FiMAP: A fast identity-by-descent mapping test for biobank-scale cohorts.
  • DOI:
    10.1371/journal.pgen.1011057
  • 发表时间:
    2023-12
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Shaojie Zhang其他文献

Shaojie Zhang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Shaojie Zhang', 18)}}的其他基金

Genome Informatics For Biobank-scale Data
生物银行规模数据的基因组信息学
  • 批准号:
    10471476
  • 财政年份:
    2021
  • 资助金额:
    $ 67.07万
  • 项目类别:
Scalable methods for identity by descent
可扩展的血统身份识别方法
  • 批准号:
    9899283
  • 财政年份:
    2018
  • 资助金额:
    $ 67.07万
  • 项目类别:
Identification, Discovery, and Public Archiving of RNA Structural Motifs
RNA 结构基序的鉴定、发现和公共存档
  • 批准号:
    8348532
  • 财政年份:
    2012
  • 资助金额:
    $ 67.07万
  • 项目类别:
Identification, Discovery, and Public Archiving of RNA Structural Motifs
RNA 结构基序的鉴定、发现和公共存档
  • 批准号:
    8723857
  • 财政年份:
    2012
  • 资助金额:
    $ 67.07万
  • 项目类别:
Identification, Discovery, and Public Archiving of RNA Structural Motifs
RNA 结构基序的鉴定、发现和公共存档
  • 批准号:
    8535798
  • 财政年份:
    2012
  • 资助金额:
    $ 67.07万
  • 项目类别:
Identification, Discovery, and Public Archiving of RNA Structural Motifs
RNA 结构基序的鉴定、发现和公共存档
  • 批准号:
    9897534
  • 财政年份:
    2012
  • 资助金额:
    $ 67.07万
  • 项目类别:

相似国自然基金

分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
  • 批准号:
    12371308
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
资源受限下集成学习算法设计与硬件实现研究
  • 批准号:
    62372198
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于物理信息神经网络的电磁场快速算法研究
  • 批准号:
    52377005
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
考虑桩-土-水耦合效应的饱和砂土变形与流动问题的SPH模型与高效算法研究
  • 批准号:
    12302257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向高维不平衡数据的分类集成算法研究
  • 批准号:
    62306119
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Implementation of an impact assessment tool to optimize responsible stewardship of genomic data in the cloud
实施影响评估工具以优化云中基因组数据的负责任管理
  • 批准号:
    10721762
  • 财政年份:
    2023
  • 资助金额:
    $ 67.07万
  • 项目类别:
HEAR-HEARTFELT (Identifying the risk of Hospitalizations or Emergency depARtment visits for patients with HEART Failure in managed long-term care through vErbaL communicaTion)
倾听心声(通过口头交流确定长期管理护理中的心力衰竭患者住院或急诊就诊的风险)
  • 批准号:
    10723292
  • 财政年份:
    2023
  • 资助金额:
    $ 67.07万
  • 项目类别:
Information-Theoretic Surprise-Driven Approach to Enhance Decision Making in Healthcare
信息论惊喜驱动方法增强医疗保健决策
  • 批准号:
    10575550
  • 财政年份:
    2023
  • 资助金额:
    $ 67.07万
  • 项目类别:
Optimizing the Diagnostic Strategy for Acute Musculoskeletal Infections in Children: Evaluating the Clinical Performance and Comparative Cost of a Noninvasive Diagnostic Technique
优化儿童急性肌肉骨骼感染的诊断策略:评估无创诊断技术的临床表现和比较成本
  • 批准号:
    10664298
  • 财政年份:
    2023
  • 资助金额:
    $ 67.07万
  • 项目类别:
Molecular origins and evolution to chemoresistance in germ cell tumors
生殖细胞肿瘤中化学耐药性的分子起源和进化
  • 批准号:
    10443070
  • 财政年份:
    2023
  • 资助金额:
    $ 67.07万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了