III: AF: Medium: Collaborative Research: Scalable and Highly Accurate Methods for Metagenomics

III:AF:中:协作研究:可扩展且高度准确的宏基因组学方法

基本信息

  • 批准号:
    1513615
  • 负责人:
  • 金额:
    $ 37.33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

Metagenomic studies of microbial communities can generate millions to billions of sequencing reads. The assignment of accurate taxonomic labels to these sequences is a critical component in many analyses, but is complicated by the fact that the majority of the organisms found in environmental or host-associated communities cannot be easily cultured in a laboratory. Even among the organisms that can be cultured, relatively few have been sequenced, even partially. Thus, many commonly encountered organisms are largely absent from existing databases of known genomes and genes. Providing taxonomic labels to metagenomic sequences, thus, requires extrapolating the knowledge contained in sequence databases to previously unseen DNA strings. Simple similarity-based approaches (e.g., picking the best database hit as the best guess at the taxonomic label) have been shown to be insufficiently accurate, leading to the development of more sophisticated methods. Further developments are necessary to handle the characteristics of emerging sequencing technologies, such as high error rates with large numbers of insertions and deletions. To date, metagenomic taxon identification methods have been evaluated with respect to their ability to estimate the distribution of bacterial taxa (species, genera, families, etc.) within a metagenomic sample. Yet, different scientific and clinical settings may require specific types of analyses, and this one type of evaluation may not be the most appropriate for all settings. For example, in a clinical setting the most important question may be to detect whether a specific pathogen is present, while in a scientific setting the most interesting question may be to be able to determine if an observed read comes from a never-been-seen-before species. New evaluation strategies must be developed that specifically target the specific needs of the application domain. All the methods developed in the project will be made into open-source software that is freely available to the scientific public. Researchers will provide training activities each year with funds available to students and postdocs from around the country, and an outreach program to minority serving institutions and women?s colleges. A summer REU program will also be provided at the University of Maryland, College Park.The team will develop a new framework for integrating the formal definition of biological use-cases with evaluation datasets and metrics in order to ensure the software being developed adequately addresses the needs of the end-users. Second, they will develop new approaches for marker-based taxon identification and abundance profiling that can leverage multiple sources of information (e.g., multiple markers) as well as handle the high error rates of third-generation sequencing technologies. These approaches will build upon experience developing TIPP - a taxonomic profiling package recently published by the team that outperforms the leading metagenomic taxonomic profiling software, in particular for novel sequences, or for longer, high-error sequences. Finally they plan to develop high-performance computing implementations of these methods in order to enable rapid analysis of sample. Speed of analysis is particularly important in clinical settings where medical treatments may depend on the rate at which the method can return an analysis. Speed is also important in non-medical applications where faster analyses enable researchers to perform deeper or broader analyses of microbial communities.
微生物群落的宏基因组学研究可以产生数百万到数十亿的测序读数。为这些序列分配准确的分类标签是许多分析中的关键组成部分,但由于在环境或宿主相关群落中发现的大多数生物体不能在实验室中容易地培养这一事实而变得复杂。即使在可以培养的生物体中,也只有相对较少的生物体被测序,甚至是部分测序。因此,许多常见的生物体在已知基因组和基因的现有数据库中基本上不存在。因此,为宏基因组序列提供分类标签需要将序列数据库中包含的知识外推到以前看不见的DNA串。简单的基于相似性的方法(例如,挑选最佳数据库命中作为分类标签的最佳猜测)已被证明不够准确,导致开发更复杂的方法。需要进一步的发展来处理新兴测序技术的特征,例如大量插入和缺失的高错误率。到目前为止,宏基因组分类单元鉴定方法已经评估了它们估计细菌分类单元(种、属、科等)分布的能力。在宏基因组样本中。然而,不同的科学和临床环境可能需要特定类型的分析,这一类型的评估可能不适合所有环境。例如,在临床环境中,最重要的问题可能是检测是否存在特定病原体,而在科学环境中,最有趣的问题可能是能够确定观察到的读数是否来自从未见过的物种。必须开发新的评估策略,专门针对应用程序领域的特定需求。 该项目中开发的所有方法都将被制作成开源软件,供科学界免费使用。研究人员将提供培训活动,每年与资金提供给学生和博士后从全国各地,并推广计划,以少数民族服务机构和妇女?s学院。马里兰州大学帕克分校还将提供一个夏季REU项目,该团队将开发一个新的框架,用于将生物用例的正式定义与评估数据集和指标相结合,以确保正在开发的软件充分满足最终用户的需求。其次,他们将开发新的方法,用于基于标记的分类单元识别和丰度分析,这些方法可以利用多种信息来源(例如,多个标记)以及处理第三代测序技术的高错误率。这些方法将建立在开发TIPP的经验基础上-TIPP是该团队最近发布的一种分类学分析软件包,其性能优于领先的宏基因组分类学分析软件,特别是对于新序列或更长的高错误序列。最后,他们计划开发这些方法的高性能计算实现,以便能够快速分析样品。分析速度在临床环境中特别重要,其中医学治疗可能取决于方法可以返回分析的速率。在非医学应用中,速度也很重要,更快的分析使研究人员能够对微生物群落进行更深入或更广泛的分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mihai Pop其他文献

GENOME ANNOUNCEMENT Complete Genome Sequence of Aggregatibacter (Haemophilus) aphrophilus NJ8700
基因组公告嗜血杆菌 NJ8700 的完整基因组序列
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Bonaventura;Robert DeSalle;Mihai Pop;Niranjan Nagarajan;D. Figurski;Daniel H. Fine;Jeffrey B. Kaplan;P. Planet
  • 通讯作者:
    P. Planet
De novo likelihood-based measures for comparing metagenomic assemblies
用于比较宏基因组组装的基于从头可能性的测量
A perspective on 16S rRNA operational taxonomic unit clustering using sequence similarity
关于使用序列相似性进行 16S rRNA 操作分类单元聚类的观点
  • DOI:
    10.1038/npjbiofilms.2016.4
  • 发表时间:
    2016-04-20
  • 期刊:
  • 影响因子:
    9.200
  • 作者:
    Nam-Phuong Nguyen;Tandy Warnow;Mihai Pop;Bryan White
  • 通讯作者:
    Bryan White
Microbiota of the Hickey Run Tributary of the Anacostia River
阿纳科斯蒂亚河希基伦支流的微生物群
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Robin Cagle;P. Ramachandran;E. Reed;Seth Commichaux;M. Mammel;D. Lacher;D. Miller;Sabina Lindley;Mihai Pop;Michael C. Bazaco;Beverly J. Wolpert;E. Strain;S. Aker;Joan Feely;A. Ottesen
  • 通讯作者:
    A. Ottesen
Characterization of Two Cryptic Plasmids Isolated in Haiti from Clinical Vibrio cholerae Non-O1/Non-O139
海地临床霍乱弧菌非 O1/非 O139 中分离的两种隐性质粒的表征
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    5.2
  • 作者:
    D. Ceccarelli;Geneviève Garriss;S. Choi;Nur A. Hasan;R. Stepanauskas;Mihai Pop;A. Huq;R. Colwell
  • 通讯作者:
    R. Colwell

Mihai Pop的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mihai Pop', 18)}}的其他基金

REU Site: Undergraduate Bioinformatics Research in Data Science for Genomics
REU 网站:基因组学数据科学本科生生物信息学研究
  • 批准号:
    2149868
  • 财政年份:
    2022
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Standard Grant
III: Small: Genome Assembly Using Sparse Sequence Information
III:小:使用稀疏序列信息进行基因组组装
  • 批准号:
    1117247
  • 财政年份:
    2011
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Standard Grant
Algorithms for the Analysis of Data from Massively-parallel Genome Sequencing
大规模并行基因组测序数据分析算法
  • 批准号:
    0844494
  • 财政年份:
    2009
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Standard Grant
III-CXT-Small: Graphs to Diversity: extracting genomic variation from sequence graphs
III-CXT-Small:多样性图表:从序列图中提取基因组变异
  • 批准号:
    0812111
  • 财政年份:
    2008
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于前瞻性队列的双酚AF联合果糖加重代谢损伤的靶向代谢组学研究
  • 批准号:
    2025JJ30049
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2-circMMP1信号轴促进结直肠癌进展的分子机制研究
  • 批准号:
    2025JJ80723
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2精氯酸甲基化调控RNA转录合成在MTAP缺失骨肉瘤T细胞耗竭中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目
BDA-366通过MYD88/NF-κB/PGC1β通路杀伤 KMT2A/AF9 AML细胞的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
Lu AF21934减少缺血性脑卒中导致的神经损伤的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
  • 批准号:
    32372727
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
  • 批准号:
    82300739
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
  • 批准号:
    82370157
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
线粒体活性氧介导的胎盘早衰在孕期双酚AF暴露致婴幼儿神经发育迟缓中的作用
  • 批准号:
    82304160
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
  • 批准号:
    82303789
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402836
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402851
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
  • 批准号:
    2422926
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402283
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402852
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402284
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402837
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402835
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Adventures in Flatland: Algorithms for Modern Memories
合作研究:AF:媒介:平地历险记:现代记忆算法
  • 批准号:
    2423105
  • 财政年份:
    2024
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Sketching for privacy and privacy for sketching
合作研究:AF:中:为隐私而素描和为素描而隐私
  • 批准号:
    2311649
  • 财政年份:
    2023
  • 资助金额:
    $ 37.33万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了