Machine learning approaches to mine evolving 3D genomes

挖掘不断演化的 3D 基因组的机器学习方法

基本信息

  • 批准号:
    RGPIN-2019-06439
  • 负责人:
  • 金额:
    $ 4.23万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

The evolutionary process that led to the diversity of genomes and species known today can be thought of as a 3 Billion-year long, massively parallel selection experiment. The outcome of this experiment, the genomes of modern species, can today be sequenced at low cost, and the genomes of hundreds of vertebrates are now publicly available. The long-term objective of my research program is to develop and apply computational methodologies to best take advantage of that incredibly rich data set to better understand the regulatory function of modern genomes such as the human genome. We stand at the convergence of three major trends in science: (i) the increased ability to sequence genomes; (ii) the development of deep learning approaches that can take advantage of large data sets to identify patterns and predict function with an unprecedented accuracy. (iii) The realization that epigenomics, and in particular 3D epigenomics play a driver role in regulating gene expression. In this exciting conjuncture, our short-term objectives are: Aim 1: Develop machine-learning approaches that can take advantage of multi-species comparison to boost accuracy of prediction of various types of regulatory elements, both transcriptional and post-transcriptional. We will develop machine learning approaches that can combine predictions made by existing bioinformatics tools on multiple orthologous sequence to boost accuracy. We will then develop new semi-supervised machine learning approaches train deep learning approaches directly on a combination of labeled genomic data and unlabeled orthologous regions. Aim 2: Use ML to improve the reconstruction of mammalian evolutionary history. We will improve the accuracy of whole-genome alignment, ancestral genome inference using deep learning and reinforcement learning. We will also focus on developing machine learning approaches to predict cell-type specific 3D genome organization (compartments, TADs) from DNA sequence, and apply the approach to both modern genomes and inferred ancestral genomes. Aim 3: Study how changes in genomic context impact regulatory functions, and how best to take this into consideration for prediction. Taking advantage of the approaches developed in Aims 1 and 2, we will study how genome rearrangements and transposable element insertion alter (predicted) 3D genome conformation and the activity of regulatory regions. We will then revise the machine learning models developed in Aim 1 to augment them with information about 3D genome context. In summary, this research program will develop cutting-edge machine learning to help study genome evolution and learn to recognize function from studying evolving genomes. By bringing together approaches from evolution, genomics, bioinformatics, and machine learning, it not only offers the opportunity for significant conceptual steps forward in both biology and computer science, but will also serve as a great conduit for training in interdisciplinary research.
导致今天已知的基因组和物种多样性的进化过程可以被认为是一个长达30亿年的大规模平行选择实验。这项实验的结果,现代物种的基因组,今天可以以低成本测序,数百种脊椎动物的基因组现在已经公开。我的研究计划的长期目标是开发和应用计算方法,以最好地利用这一令人难以置信的丰富数据集,以更好地了解现代基因组(如人类基因组)的调控功能。我们站在科学三大趋势的交汇点上:(i)基因组测序能力的提高;(ii)深度学习方法的发展,可以利用大型数据集来识别模式并以前所未有的准确度预测功能。(iii)认识到表观基因组学,特别是3D表观基因组学在调节基因表达中起着驱动作用。在这个激动人心的时刻,我们的短期目标是:目标1:开发机器学习方法,可以利用多物种比较来提高预测各种类型的调控元件的准确性,包括转录和转录后。我们将开发机器学习方法,这些方法可以将现有生物信息学工具对多个正交序列的预测联合收割机结合起来,以提高准确性。然后,我们将开发新的半监督机器学习方法,直接在标记的基因组数据和未标记的正交区域的组合上训练深度学习方法。 目标2:使用ML改进哺乳动物进化历史的重建。我们将提高全基因组比对的准确性,使用深度学习和强化学习进行祖先基因组推断。我们还将专注于开发机器学习方法,从DNA序列中预测细胞类型特异性3D基因组组织(隔室,TADs),并将该方法应用于现代基因组和推断的祖先基因组。目标3:研究基因组环境的变化如何影响调控功能,以及如何最好地将其考虑在内进行预测。利用目标1和2中开发的方法,我们将研究基因组重排和转座因子插入如何改变(预测)3D基因组构象和调控区的活性。然后,我们将修改Aim 1中开发的机器学习模型,以增加有关3D基因组背景的信息。 总之,该研究计划将开发尖端的机器学习,以帮助研究基因组进化,并学会通过研究进化的基因组来识别功能。通过汇集来自进化,基因组学,生物信息学和机器学习的方法,它不仅为生物学和计算机科学的重大概念性步骤提供了机会,而且还将成为跨学科研究培训的重要渠道。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Blanchette, Mathieu其他文献

Reference panel guided topological structure annotation of Hi-C data.
  • DOI:
    10.1038/s41467-022-35231-3
  • 发表时间:
    2022-12-02
  • 期刊:
  • 影响因子:
    16.6
  • 作者:
    Zhang, Yanlin;Blanchette, Mathieu
  • 通讯作者:
    Blanchette, Mathieu
LAMPS: an analysis pipeline for sequence-specific ligation-mediated amplification reads
  • DOI:
    10.1186/s13104-020-05106-1
  • 发表时间:
    2020-06-03
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Cameron, Christopher J. F.;Wang, Xue Q. D.;Blanchette, Mathieu
  • 通讯作者:
    Blanchette, Mathieu
Detecting non-coding selective pressure in coding regions
  • DOI:
    10.1186/1471-2148-7-s1-s9
  • 发表时间:
    2007-01-01
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Chen, Hui;Blanchette, Mathieu
  • 通讯作者:
    Blanchette, Mathieu
Genetic Map Refinement Using a Comparative Genomic Approach
  • DOI:
    10.1089/cmb.2009.0094
  • 发表时间:
    2009-01-01
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    Bertrand, Denis;Blanchette, Mathieu;El-Mabrouk, Nadia
  • 通讯作者:
    El-Mabrouk, Nadia
On the inference of parsimonious indel evolutionary scenarios

Blanchette, Mathieu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Blanchette, Mathieu', 18)}}的其他基金

Machine learning approaches to mine evolving 3D genomes
挖掘不断演化的 3D 基因组的机器学习方法
  • 批准号:
    RGPIN-2019-06439
  • 财政年份:
    2021
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Machine learning approaches to mine evolving 3D genomes
挖掘不断演化的 3D 基因组的机器学习方法
  • 批准号:
    RGPIN-2019-06439
  • 财政年份:
    2020
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Machine learning approaches to mine evolving 3D genomes
挖掘不断演化的 3D 基因组的机器学习方法
  • 批准号:
    RGPIN-2019-06439
  • 财政年份:
    2019
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    262081-2013
  • 财政年份:
    2018
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    262081-2013
  • 财政年份:
    2017
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    262081-2013
  • 财政年份:
    2016
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    262081-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    445988-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    445988-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Computational inference and analysis of ancestral genomes
祖先基因组的计算推理和分析
  • 批准号:
    262081-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Automating data acquisition and data processing pipeline via artificial intelligence and machine learning approaches to allow at-home use of a novel breast cancer screening method employing bra-based elastography imaging.
通过人工智能和机器学习方法自动化数据采集和数据处理流程,以便在家使用基于胸罩的弹性成像成像的新型乳腺癌筛查方法。
  • 批准号:
    486956
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Operating Grants
Developing machine learning based approaches to weld residual stress problems
开发基于机器学习的方法来解决焊接残余应力问题
  • 批准号:
    2894296
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Studentship
Determining the ototoxic potential of COVID-19 therapeutics using machine learning and in vivo approaches
使用机器学习和体内方法确定 COVID-19 疗法的耳毒性潜力
  • 批准号:
    10732745
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
Research Initiation Award: Uncovering and Extracting Biological Information from Nanopore Long-read Sequencing Data with Machine Learning and Mathematical Approaches
研究启动奖:利用机器学习和数学方法从纳米孔长读长测序数据中发现和提取生物信息
  • 批准号:
    2300445
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Standard Grant
CAREER: Combining Machine Learning and Physics-based Modeling Approaches for Accelerating Scientific Discovery
职业:结合机器学习和基于物理的建模方法来加速科学发现
  • 批准号:
    2239175
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Continuing Grant
Developing novel machine learning approaches to studying cell development
开发新的机器学习方法来研究细胞发育
  • 批准号:
    2326879
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Continuing Grant
Improving aerosol and spray process computation fluid dynamics models with machine learning approaches
利用机器学习方法改进气溶胶和喷雾过程计算流体动力学模型
  • 批准号:
    2881557
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Studentship
Target identification from multiomics data using systems biology and machine learning approaches
使用系统生物学和机器学习方法从多组学数据中识别目标
  • 批准号:
    BB/Y512734/1
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Training Grant
Cheminformatics and Machine Learning approaches for GPCR Computer Aided Drug Design
GPCR 计算机辅助药物设计的化学信息学和机器学习方法
  • 批准号:
    BB/X511778/1
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Training Grant
Constructing a Digital Twin for a self-correcting Scanning Transmission Electron Microscope using Machine Learning Approaches
使用机器学习方法构建自校正扫描透射电子显微镜的数字孪生
  • 批准号:
    2889721
  • 财政年份:
    2023
  • 资助金额:
    $ 4.23万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了