Machine learning methods for genome reconstruction in metagenomics

宏基因组学中基因组重建的机器学习方法

基本信息

  • 批准号:
    324226106
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    德国
  • 项目类别:
    Research Grants
  • 财政年份:
    2016
  • 资助国家:
    德国
  • 起止时间:
    2015-12-31 至 2019-12-31
  • 项目状态:
    已结题

项目摘要

Metagenomics has become a standard approach for the analysis of microbial communities. The sequencing of environmental or clinical samples results in large collections of short sequence fragments that enable a comprehensive analysis of the species composition and the metabolic potential. The progress in sequencing technologies has given rise to a significantly increased sequencing depth so that it has become possible to assemble long contiguous regions (contigs) of microbial genomes even for the most complex communities. Recent studies have shown that it is possible to reconstruct nearly complete genomes by grouping these contigs into genome-specific bins. Metagenome binning is a computationally challenging problem, and although current binning tools for genome recovery are all based on similar clustering techniques, the quality of results depends on user specifications and largely varies across different communities and tools. To fully exploit the potential of metagenome binning for genome reconstruction, we aim to develop a machine learning framework that will enable an automatic optimization of the accuracy and the reproducibility of results. To achieve this goal we will integrate state-of-the-art machine learning models together with statistical models for count data and a simulation-based control of the overall model quality. In a collaboration with the Joint Genome Institute in Walnut Creek we will develop a new approach to assess the completeness and contamination of recovered genomes based on the protein domain content and on alignments with known genomes. In contrast to the common workflow of metagenome binning which applies quality checks just to the final bins we will include quality control as an integral part of the machine learning-based bin optimization process. In an ongoing collaboration with the Department of Genomic and Applied Microbiology in Göttingen we will also investigate how long reads from third generation sequencing technologies can be utilized to measure and improve binning accuracy. Together with our Göttingen collaboration partner from the Department of Forest Botany and Tree Physiology we aim to extend the binning approach to fungal communities which will open up new possibilities for research in ecology.
宏基因组学已经成为微生物群落分析的标准方法。环境或临床样本的测序结果是大量的短序列片段,可以对物种组成和代谢潜力进行全面分析。测序技术的进步大大提高了测序深度,因此即使对于最复杂的群落,也可以组装长连续区域(contigs)的微生物基因组。最近的研究表明,通过将这些contigs分组到基因组特异性箱中,可以重建几乎完整的基因组。宏基因组分组是一个计算上具有挑战性的问题,尽管目前用于基因组恢复的分组工具都基于类似的聚类技术,但结果的质量取决于用户规格,并且在不同的社区和工具之间差异很大。为了充分利用宏基因组分类在基因组重建中的潜力,我们的目标是开发一个机器学习框架,该框架将能够自动优化结果的准确性和可重复性。为了实现这一目标,我们将把最先进的机器学习模型与计数数据的统计模型和基于仿真的整体模型质量控制结合起来。在与Walnut Creek的联合基因组研究所的合作中,我们将开发一种基于蛋白质结构域含量和与已知基因组比对来评估恢复基因组的完整性和污染的新方法。与将质量检查应用于最终箱的元基因组箱的常见工作流程相反,我们将把质量控制作为基于机器学习的箱优化过程的一个组成部分。在与Göttingen基因组学和应用微生物学部门的持续合作中,我们还将研究第三代测序技术的长度读数可以用于测量和提高分集精度。与森林植物学和树木生理学部门的Göttingen合作伙伴一起,我们的目标是将分类方法扩展到真菌群落,这将为生态学研究开辟新的可能性。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BinChecker: a new algorithm for quality assessment of microbial draft genomes
BinChecker:一种用于微生物基因组草图质量评估的新算法
  • DOI:
    10.1101/2021.10.01.462745
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Heiner Klingenberg;Peter Meinicke
  • 通讯作者:
    Peter Meinicke
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dr. Peter Meinicke其他文献

Dr. Peter Meinicke的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dr. Peter Meinicke', 18)}}的其他基金

Computational models for metatranscriptome analysis
宏转录组分析的计算模型
  • 批准号:
    215674903
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Compositional descriptors for large scale comparative metagenome analysis
用于大规模比较宏基因组分析的组成描述符
  • 批准号:
    178869699
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Combining Machine Learning Explanation Methods with Expectancy-Value Theory to Identify Tailored Interventions for Engineering Student Persistence
将机器学习解释方法与期望值理论相结合,确定针对工程学生坚持的定制干预措施
  • 批准号:
    2335725
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
High-Valent Iron-Oxo Species for Activation of Strong CH Bonds: New Designs with Novel Ab Initio Methods and Machine Learning
用于激活强CH键的高价铁氧物种:采用新颖的从头算方法和机器学习的新设计
  • 批准号:
    24K17694
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Is evolution predictable? Unlocking fundamental biological insights using new machine learning methods
进化是可预测的吗?
  • 批准号:
    MR/X033880/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Fellowship
CAREER: Machine learning, Mapping Spaces, and Obstruction Theoretic Methods in Topological Data Analysis
职业:拓扑数据分析中的机器学习、映射空间和障碍理论方法
  • 批准号:
    2415445
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Using Novel Machine Learning Methods to Personalize Strategies for Prevention of Persistent AKI after Cardiac Surgery
使用新颖的机器学习方法制定个性化策略,预防心脏手术后持续性 AKI
  • 批准号:
    10979324
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
Theoretical Guarantees of Machine Learning Methods for High Dimensional Partial Differential Equations: Numerical Analysis and Uncertainty Quantification
高维偏微分方程机器学习方法的理论保证:数值分析和不确定性量化
  • 批准号:
    2343135
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Leveraging Causal Inference and Machine Learning Methods to Advance Evidence-Based Maternal Care and Improve Newborn Health Outcomes
利用因果推理和机器学习方法推进循证孕产妇护理并改善新生儿健康结果
  • 批准号:
    10604856
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
CRCNS: Identifying principles of auditory cortical organization with machine learning
CRCNS:通过机器学习识别听觉皮层组织的原理
  • 批准号:
    10830506
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Cloud-Based Machine Learning and Biomarker Visual Analytics for Salivary Proteomics
基于云的机器学习和唾液蛋白质组生物标志物可视化分析
  • 批准号:
    10827649
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Next-Generation Algorithms in Statistical Genetics Based on Modern Machine Learning
基于现代机器学习的下一代统计遗传学算法
  • 批准号:
    10714930
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了