III: AF: Medium: Collaborative Research: Scalable and Highly Accurate Methods for Metagenomics

III:AF:中:协作研究:可扩展且高度准确的宏基因组学方法

基本信息

  • 批准号:
    1513629
  • 负责人:
  • 金额:
    $ 62.67万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

Metagenomic studies of microbial communities can generate millions to billions of sequencing reads. The assignment of accurate taxonomic labels to these sequences is a critical component in many analyses, but is complicated by the fact that the majority of the organisms found in environmental or host-associated communities cannot be easily cultured in a laboratory. Even among the organisms that can be cultured, relatively few have been sequenced, even partially. Thus, many commonly encountered organisms are largely absent from existing databases of known genomes and genes. Providing taxonomic labels to metagenomic sequences, thus, requires extrapolating the knowledge contained in sequence databases to previously unseen DNA strings. Simple similarity-based approaches (e.g., picking the best database hit as the best guess at the taxonomic label) have been shown to be insufficiently accurate, leading to the development of more sophisticated methods. Further developments are necessary to handle the characteristics of emerging sequencing technologies, such as high error rates with large numbers of insertions and deletions. To date, metagenomic taxon identification methods have been evaluated with respect to their ability to estimate the distribution of bacterial taxa (species, genera, families, etc.) within a metagenomic sample. Yet, different scientific and clinical settings may require specific types of analyses, and this one type of evaluation may not be the most appropriate for all settings. For example, in a clinical setting the most important question may be to detect whether a specific pathogen is present, while in a scientific setting the most interesting question may be to be able to determine if an observed read comes from a never-been-seen-before species. New evaluation strategies must be developed that specifically target the specific needs of the application domain. All the methods developed in the project will be made into open-source software that is freely available to the scientific public. Researchers will provide training activities each year with funds available to students and postdocs from around the country, and an outreach program to minority serving institutions and women?s colleges. A summer REU program will also be provided at the University of Maryland, College Park.The team will develop a new framework for integrating the formal definition of biological use-cases with evaluation datasets and metrics in order to ensure the software being developed adequately addresses the needs of the end-users. Second, they will develop new approaches for marker-based taxon identification and abundance profiling that can leverage multiple sources of information (e.g., multiple markers) as well as handle the high error rates of third-generation sequencing technologies. These approaches will build upon experience developing TIPP - a taxonomic profiling package recently published by the team that outperforms the leading metagenomic taxonomic profiling software, in particular for novel sequences, or for longer, high-error sequences. Finally they plan to develop high-performance computing implementations of these methods in order to enable rapid analysis of sample. Speed of analysis is particularly important in clinical settings where medical treatments may depend on the rate at which the method can return an analysis. Speed is also important in non-medical applications where faster analyses enable researchers to perform deeper or broader analyses of microbial communities.
微生物群落的宏基因组研究可以产生数百万到数十亿的测序读数。为这些序列分配准确的分类标签是许多分析中的关键组成部分,但由于环境或宿主相关群落中发现的大多数生物体无法在实验室中轻易培养,这一事实使情况变得复杂。即使在可培养的生物体中,也只有相对较少的生物被测序,甚至是部分测序。因此,许多常见的生物体在已知基因组和基因的现有数据库中基本上不存在。因此,为宏基因组序列提供分类标签需要将序列数据库中包含的知识外推到以前未见过的 DNA 字符串。简单的基于相似性的方法(例如,选择最佳的数据库命中作为对分类标签的最佳猜测)已被证明不够准确,导致了更复杂的方法的开发。需要进一步的发展来处理新兴测序技术的特征,例如大量插入和缺失的高错误率。迄今为止,宏基因组分类单元识别方法已经评估了其估计宏基因组样本中细菌分类单元(种、属、科等)分布的能力。然而,不同的科学和临床环境可能需要特定类型的分析,并且这种类型的评估可能并不适合所有环境。例如,在临床环境中,最重要的问题可能是检测是否存在特定病原体,而在科学环境中,最有趣的问题可能是能够确定观察到的读数是否来自以前从未见过的物种。必须开发专门针对应用领域的特定需求的新评估策略。 该项目中开发的所有方法都将制成开源软件,免费提供给科学公众。研究人员每年将向全国各地的学生和博士后提供资金提供培训活动,并向少数族裔服务机构和女子学院提供外展计划。马里兰大学帕克分校还将提供夏季 REU 项目。该团队将开发一个新框架,将生物用例的正式定义与评估数据集和指标相结合,以确保正在开发的软件充分满足最终用户的需求。其次,他们将开发基于标记的分类单元识别和丰度分析的新方法,该方法可以利用多个信息源(例如多个标记)并处理第三代测序技术的高错误率。这些方法将建立在开发 TIPP 的经验之上,TIPP 是该团队最近发布的分类分析软件包,其性能优于领先的宏基因组分类分析软件,特别是对于新颖序列或较长、高错误序列。最后,他们计划开发这些方法的高性能计算实现,以便能够快速分析样本。分析速度在临床环境中尤其重要,其中医疗可能取决于方法返回分析的速率。速度在非医学应用中也很重要,更快的分析使研究人员能够对微生物群落进行更深入或更广泛的分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tandy Warnow其他文献

EC-SBM synthetic network generator
  • DOI:
    10.1007/s41109-025-00701-2
  • 发表时间:
    2025-05-01
  • 期刊:
  • 影响因子:
    1.500
  • 作者:
    The-Anh Vu-Le;Lahari Anne;George Chacko;Tandy Warnow
  • 通讯作者:
    Tandy Warnow
A perspective on 16S rRNA operational taxonomic unit clustering using sequence similarity
关于使用序列相似性进行 16S rRNA 操作分类单元聚类的观点
  • DOI:
    10.1038/npjbiofilms.2016.4
  • 发表时间:
    2016-04-20
  • 期刊:
  • 影响因子:
    9.200
  • 作者:
    Nam-Phuong Nguyen;Tandy Warnow;Mihai Pop;Bryan White
  • 通讯作者:
    Bryan White
Correction to: The performance of coalescent-based species tree estimation methods under models of missing data
  • DOI:
    10.1186/s12864-020-6540-1
  • 发表时间:
    2020-02-10
  • 期刊:
  • 影响因子:
    3.700
  • 作者:
    Michael Nute;Jed Chou;Erin K. Molloy;Tandy Warnow
  • 通讯作者:
    Tandy Warnow
Analyzing the Order of Items in Manuscripts of The Canterbury Tales
  • DOI:
    10.1023/a:1021818600001
  • 发表时间:
    2003-02-01
  • 期刊:
  • 影响因子:
    1.800
  • 作者:
    Matthew Spencer;Barbara Bordalejo;Li-San Wang;Adrian C. Barbrook;Linne R. Mooney;Peter Robinson;Tandy Warnow;Christopher J. Howe
  • 通讯作者:
    Christopher J. Howe
An experimental study of Quartets MaxCut and other supertree methods
  • DOI:
    10.1186/1748-7188-6-7
  • 发表时间:
    2011-04-19
  • 期刊:
  • 影响因子:
    1.700
  • 作者:
    M Shel Swenson;Rahul Suri;C Randal Linder;Tandy Warnow
  • 通讯作者:
    Tandy Warnow

Tandy Warnow的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tandy Warnow', 18)}}的其他基金

IIBR Informatics: Advancing Bioinformatics Methods using Ensembles of Profile Hidden Markov Models
IIBR 信息学:使用轮廓隐马尔可夫模型集成推进生物信息学方法
  • 批准号:
    2006069
  • 财政年份:
    2020
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant
AitF: Full: Collaborative Research: Graph-theoretic algorithms to improve phylogenomic analyses
AitF:完整:协作研究:改进系统发育分析的图论算法
  • 批准号:
    1535977
  • 财政年份:
    2015
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant
ABI Innovation: New methods for multiple sequence alignment with improved accuracy and scalability
ABI Innovation:多序列比对的新方法,具有更高的准确性和可扩展性
  • 批准号:
    1458652
  • 财政年份:
    2015
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
  • 批准号:
    1461364
  • 财政年份:
    2014
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
  • 批准号:
    1062335
  • 财政年份:
    2011
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant
Collaborative Research: Large-scale simultaneous multiple alignment and phylogeny estimation
合作研究:大规模同时多重比对和系统发育估计
  • 批准号:
    0733029
  • 财政年份:
    2007
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
  • 批准号:
    0715370
  • 财政年份:
    2006
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Cooperative Agreement
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
  • 批准号:
    0331654
  • 财政年份:
    2003
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Cooperative Agreement
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
  • 批准号:
    0331453
  • 财政年份:
    2003
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Cooperative Agreement
ITR: Collaborative Research, Algorithms for Inferring Reticulate Evolution in Historical Linguistics
ITR:历史语言学中推断网状进化的协作研究和算法
  • 批准号:
    0312830
  • 财政年份:
    2003
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Standard Grant

相似国自然基金

基于前瞻性队列的双酚AF联合果糖加重代谢损伤的靶向代谢组学研究
  • 批准号:
    2025JJ30049
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2-circMMP1信号轴促进结直肠癌进展的分子机制研究
  • 批准号:
    2025JJ80723
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2精氯酸甲基化调控RNA转录合成在MTAP缺失骨肉瘤T细胞耗竭中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目
BDA-366通过MYD88/NF-κB/PGC1β通路杀伤 KMT2A/AF9 AML细胞的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
Lu AF21934减少缺血性脑卒中导致的神经损伤的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
  • 批准号:
    32372727
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
  • 批准号:
    82300739
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
  • 批准号:
    82370157
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
线粒体活性氧介导的胎盘早衰在孕期双酚AF暴露致婴幼儿神经发育迟缓中的作用
  • 批准号:
    82304160
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
  • 批准号:
    82303789
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402836
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402851
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
  • 批准号:
    2422926
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402283
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402852
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402284
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402837
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402835
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Adventures in Flatland: Algorithms for Modern Memories
合作研究:AF:媒介:平地历险记:现代记忆算法
  • 批准号:
    2423105
  • 财政年份:
    2024
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Sketching for privacy and privacy for sketching
合作研究:AF:中:为隐私而素描和为素描而隐私
  • 批准号:
    2311649
  • 财政年份:
    2023
  • 资助金额:
    $ 62.67万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了