Computational methods to interpret genomic variation and integrate functional genomics data in genetic analysis of human diseases

解释基因组变异并将功能基因组数据整合到人类疾病遗传分析中的计算方法

基本信息

  • 批准号:
    10623773
  • 负责人:
  • 金额:
    $ 40.69万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-06-01 至 2028-05-31
  • 项目状态:
    未结题

项目摘要

Abstract The overall research direction in my lab is to develop new computational methods to enable new discovery in genetic studies of human diseases. We design methods using machine learning models based on biological intuitions to extract knowledge from large genome sequencing and functional genomics data sets. Recent large-scale genome and exome sequencing studies of human diseases have successfully identified novel risk genes and improved diagnostic yields in clinical genetic testing, especially in rare diseases, developmental disorders, and cancer. However, many significant genetic questions remain unsolved and cannot be solved by the accumulation of genetic data alone. Most of the risk genes of human diseases are still unknown. In particular, the role of rare variants has been under-studied. One major bottleneck is the lack of highly accurate and automated tools to interpret genetic variation. Rare missense variants account for most of protein-coding variants with potential functional impact; however, most of them do not contribute to diseases. The inability to accurately predict their functional impact is a critical hurdle to identify risk genes in genetic research studies and to disambiguate variants of uncertain significance in clinical practice. We see a unique opportunity to dramatically improve computational methods in next five years, due to the following confluent factors: accumulating large population genome sequence data, modern deep learning methods to model genomic and protein sequence and structure, human functional genomics data across cell types and developmental stages, and scalable methods to profile molecular effect of genetic variants. We will focus on three areas. The first is computational prediction of functional impact of missense variants. We use deep neural networks to learn effective representation of protein sequence and structure in prediction models and use probabilistic graphical models to jointly estimate effects at molecular and population levels. The second is computational integration of functional genomics and genetics data. We will fuse machine learning with statistical genetics to develop methods that model disease genetic data together with single cell expression and regulatory profiles of normal individuals. The methods will improve both statistical power of new risk gene discovery and generate biological insights of disease etiology. Third, we will continue to develop new bioinformatics tools to improve detecting and automated confirmation of copy number variants and mosaic mutations from large-scale genomics data. Finally, our collaboration with experts in medical genetics will provide positive feedback loops to improve the methods and generate new biological insights and clinical utility. Our research will produce new methods to analyze genomics data, and ultimately these methods will enable new discoveries in disease genetic studies and improve the yield of clinical genetic diagnostics.
摘要 我实验室的总体研究方向是开发新的计算方法,使基因的新发现成为可能 对人类疾病的研究。我们设计的方法使用基于生物直觉的机器学习模型来提取 来自大型基因组测序和功能基因组数据集的知识。 最近对人类疾病的大规模基因组和外显子组测序研究成功地确定了新的风险 临床基因检测中的基因和提高的诊断效率,特别是在罕见疾病、发育障碍和 癌症。然而,许多重大的遗传问题仍然没有得到解决,也不能通过基因的积累来解决 仅数据一项。大多数人类疾病的风险基因仍是未知的。特别是,稀有变种的作用一直是 研究不足。一个主要的瓶颈是缺乏高度准确和自动化的工具来解释遗传变异。1~2成熟 错义变体解释了大多数具有潜在功能影响的蛋白质编码变体;然而,它们中的大多数 不要助长疾病。无法准确预测其功能影响是识别风险的关键障碍 基因在遗传学研究中的应用以及消除临床实践中不确定意义的变异的歧义。我们看到了一个 在未来五年内显著改进计算方法的独特机会,归功于以下融合 因素:积累大量的种群基因组序列数据,建立基因组模型的现代深度学习方法和 蛋白质序列和结构,跨细胞类型和发育阶段的人类功能基因组数据,以及可扩展的 方法对遗传变异的分子效应进行分析。我们将重点抓好三个方面。第一个是计算预测 错义变体的功能影响。我们使用深度神经网络来学习蛋白质的有效表示 预测模型中的序列和结构,并使用概率图形模型联合估计分子的影响 和人口水平。第二个是功能基因组学和遗传学数据的计算集成。我们将引信 机器学习与统计遗传学相结合,开发与单细胞一起建模疾病遗传数据的方法 正常个体的表达和调控特征。这些方法将提高新风险基因的统计能力 发现并产生对疾病病因学的生物学见解。第三,我们将继续开发新的生物信息学工具 改进大规模拷贝数变异和马赛克突变的检测和自动确认 基因组学数据。 最后,我们与医学遗传学专家的合作将提供改进方法的正反馈循环 并产生新的生物学见解和临床应用。我们的研究将产生分析基因组数据的新方法, 最终,这些方法将使疾病遗传学研究中的新发现成为可能,并提高临床研究的成果 基因诊断学。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yufeng Shen其他文献

Yufeng Shen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yufeng Shen', 18)}}的其他基金

Computational analysis of whole genome sequence data for discovering novel risk genes of structural birth defects
全基因组序列数据的计算分析,以发现结构性出生缺陷的新风险基因
  • 批准号:
    10354418
  • 财政年份:
    2022
  • 资助金额:
    $ 40.69万
  • 项目类别:
Computational analysis of whole genome sequence data for discovering novel risk genes of structural birth defects
全基因组序列数据的计算分析,以发现结构性出生缺陷的新风险基因
  • 批准号:
    10673600
  • 财政年份:
    2022
  • 资助金额:
    $ 40.69万
  • 项目类别:
Integrate cancer genomics data in genetic studies and diagnosis of developmental disorders
将癌症基因组学数据整合到遗传研究和发育障碍的诊断中
  • 批准号:
    10166608
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Integrated Genomics Core
综合基因组核心
  • 批准号:
    10458159
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Integrated Genomics Core
综合基因组核心
  • 批准号:
    10647825
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Integrate cancer genomics data in genetic studies and diagnosis of developmental disorders
将癌症基因组学数据整合到遗传研究和发育障碍的诊断中
  • 批准号:
    9311160
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Bioinformatics & Data Management
生物信息学
  • 批准号:
    10176371
  • 财政年份:
    2013
  • 资助金额:
    $ 40.69万
  • 项目类别:
Bioinformatics & Data Management
生物信息学
  • 批准号:
    10426136
  • 财政年份:
    2013
  • 资助金额:
    $ 40.69万
  • 项目类别:
Bioinformatics
生物信息学
  • 批准号:
    8576997
  • 财政年份:
    2013
  • 资助金额:
    $ 40.69万
  • 项目类别:
Bioinformatics
生物信息学
  • 批准号:
    8703320
  • 财政年份:
  • 资助金额:
    $ 40.69万
  • 项目类别:

相似海外基金

The establishment of the Prime Editing database for personalized genetic medicine
个性化遗传医学Prime Editing数据库的建立
  • 批准号:
    21K17855
  • 财政年份:
    2021
  • 资助金额:
    $ 40.69万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
The practice of telegenic counseling to address unmet needs in genetic medicine
电视咨询实践解决遗传医学中未满足的需求
  • 批准号:
    20K19082
  • 财政年份:
    2020
  • 资助金额:
    $ 40.69万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Advancing Recognition and Personalized Genetic Medicine for MODY in a Multi-Ethnic US Population
促进美国多民族人群中 MODY 的识别和个性化遗传医学
  • 批准号:
    9371681
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Advancing Recognition and Personalized Genetic Medicine for MODY in a Multi-Ethnic US Population
促进美国多民族人群中 MODY 的识别和个性化遗传医学
  • 批准号:
    10393157
  • 财政年份:
    2017
  • 资助金额:
    $ 40.69万
  • 项目类别:
Construction of complementary genetic testing system for Mendelian genetic disease and social implementation in genetic medicine
孟德尔遗传病补充基因检测体系构建及遗传医学社会实施
  • 批准号:
    16K08980
  • 财政年份:
    2016
  • 资助金额:
    $ 40.69万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
UNDERSTANDING AFRICAN AMERICANS' RECEPTIVITY TO GENETIC MEDICINE AND RESEARCH
了解非裔美国人对基因医学和研究的接受程度
  • 批准号:
    8467002
  • 财政年份:
    2012
  • 资助金额:
    $ 40.69万
  • 项目类别:
UNDERSTANDING AFRICAN AMERICANS' RECEPTIVITY TO GENETIC MEDICINE AND RESEARCH
了解非裔美国人对基因医学和研究的接受程度
  • 批准号:
    8299283
  • 财政年份:
    2012
  • 资助金额:
    $ 40.69万
  • 项目类别:
Pulmonary Genetic Medicine Training Program
肺遗传医学培训计划
  • 批准号:
    8499391
  • 财政年份:
    2009
  • 资助金额:
    $ 40.69万
  • 项目类别:
The Role of Behavioral Science in Personalized Genetic Medicine
行为科学在个性化基因医学中的作用
  • 批准号:
    7921744
  • 财政年份:
    2009
  • 资助金额:
    $ 40.69万
  • 项目类别:
Pulmonary Genetic Medicine Training Program
肺遗传医学培训计划
  • 批准号:
    7939622
  • 财政年份:
    2009
  • 资助金额:
    $ 40.69万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了