Methods for sequencing data analysis and archive-scale data science

排序数据分析和档案规模数据科学的方法

基本信息

  • 批准号:
    10548746
  • 负责人:
  • 金额:
    $ 51.41万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-01-01 至 2025-12-31
  • 项目状态:
    未结题

项目摘要

PROJECT SUMMARY We will develop methods and maintain software that make it radically easier for biomedical researchers to use and understand sequencing data. The project will support our maintaining and improving our popular “upstream” tools for analyzing sequencing data. These include the Bowtie and Bowtie 2 tools for read alignment, the Kraken 2 tool for metagenomics classification and the Dashing tool for genomic sketching and comparison. We will also develop new systems that allow researchers to use these same core tools (Bowtie, Kraken 2, Dashing) to rapidly discover and vet archived datasets. We will enable researchers to quickly ascertain whether a dataset is of high quality, what species are present, whether contaminants are present, what assay was performed, what datasets are similar to each other, and what datasets are inconsistent with annotated metadata. In this way, researchers can distill relevant archived datasets, those having the expected biological properties, in a way that does not hinge on the accuracy of the associated metadata. Finally, we will work to develop new infrastructure for large-scale reanalysis and indexing of archived data, ultimately yielding new “search engines” for scientific question-answering. In particular, we will extend our past work on the Rail-RNA, recount2 and Snaptron so that we can more effectively analyze huge collections of archived data, converting them into a variety of useful summary forms, and than adding a layer of indexing so that users can query the summaries in the context of a scientific investigation. We will also create new catalogs and mechanisms whereby researchers can share their archive-assisted study designs, so that useful combinations of archived datasets, and insights into where their metadata might be incorrect or incomplete, can be reported and shared.
项目摘要 我们将开发方法和维护软件,使生物医学研究人员更容易地 使用和理解测序数据。该项目将支持我们维持和改善我们的受欢迎的 用于分析测序数据的“上游”工具。其中包括Bowtie和Bowtie 2工具, 用于宏基因组学分类的Kraken 2工具和用于基因组草图绘制的Dashing工具 和比较。我们还将开发新的系统,使研究人员能够使用这些相同的核心工具 (Bowtie,Kraken 2,Dashing)快速发现和审查归档数据集。我们将使研究人员能够 快速确定数据集是否具有高质量,存在哪些物种,是否存在污染物, 存在,执行了什么测定,哪些数据集彼此相似,以及哪些数据集 与注释的元数据不一致。通过这种方式,研究人员可以提取相关的存档数据集, 具有预期的生物学特性,以一种不依赖于相关生物学特性的准确性的方式, 元数据.最后,我们将努力开发新的基础设施,用于大规模的再分析和索引。 存档数据,最终产生新的“搜索引擎”,用于科学问答。特别是, 我们将扩展我们过去在Rail-RNA、recount 2和Snaptron上的工作,以便我们能够更有效地 分析大量存档数据,将其转换为各种有用的摘要形式, 而不是增加一层索引,以便用户可以在科学的背景下查询摘要, 调查我们还将创建新的目录和机制,使研究人员可以分享他们的 存档辅助研究设计,以便存档数据集的有用组合,并深入了解 他们的元数据可能不正确或不完整,可以报告和共享。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Benjamin Thomas Langmead其他文献

Benjamin Thomas Langmead的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Benjamin Thomas Langmead', 18)}}的其他基金

Methods for sequencing data analysis and archive-scale data science
排序数据分析和档案规模数据科学的方法
  • 批准号:
    10322369
  • 财政年份:
    2021
  • 资助金额:
    $ 51.41万
  • 项目类别:
Personal and panel references for improved alignment
用于改进对齐的个人和面板参考
  • 批准号:
    10242948
  • 财政年份:
    2020
  • 资助金额:
    $ 51.41万
  • 项目类别:
Personal and panel references for improved alignment
用于改进对齐的个人和面板参考
  • 批准号:
    10057490
  • 财政年份:
    2020
  • 资助金额:
    $ 51.41万
  • 项目类别:
Personal and panel references for improved alignment
用于改进对齐的个人和面板参考
  • 批准号:
    10655473
  • 财政年份:
    2020
  • 资助金额:
    $ 51.41万
  • 项目类别:
Personal and panel references for improved alignment
用于改进对齐的个人和面板参考
  • 批准号:
    10443815
  • 财政年份:
    2020
  • 资助金额:
    $ 51.41万
  • 项目类别:
Hardening and Scaling Core Genomics Software
强化和扩展核心基因组学软件
  • 批准号:
    9922953
  • 财政年份:
    2016
  • 资助金额:
    $ 51.41万
  • 项目类别:

相似海外基金

Defining the biological boundaries to sustain extant life on Mars
定义维持火星现存生命的生物边界
  • 批准号:
    DP240102658
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Discovery Projects
Advanced Multiscale Biological Imaging using European Infrastructures
利用欧洲基础设施进行先进的多尺度生物成像
  • 批准号:
    EP/Y036654/1
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Research Grant
Open Access Block Award 2024 - Marine Biological Association
2024 年开放获取区块奖 - 海洋生物学协会
  • 批准号:
    EP/Z532538/1
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Research Grant
NSF/BIO-DFG: Biological Fe-S intermediates in the synthesis of nitrogenase metalloclusters
NSF/BIO-DFG:固氮酶金属簇合成中的生物 Fe-S 中间体
  • 批准号:
    2335999
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
DESIGN: Driving Culture Change in a Federation of Biological Societies via Cohort-Based Early-Career Leaders
设计:通过基于队列的早期职业领袖推动生物协会联盟的文化变革
  • 批准号:
    2334679
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
Collaborative Research: The Interplay of Water Condensation and Fungal Growth on Biological Surfaces
合作研究:水凝结与生物表面真菌生长的相互作用
  • 批准号:
    2401507
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
REU Site: Modeling the Dynamics of Biological Systems
REU 网站:生物系统动力学建模
  • 批准号:
    2243955
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: Large Language Models for Biological Discoveries (LLMs4Bio)
合作研究:会议:生物发现的大型语言模型 (LLMs4Bio)
  • 批准号:
    2411529
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: Large Language Models for Biological Discoveries (LLMs4Bio)
合作研究:会议:生物发现的大型语言模型 (LLMs4Bio)
  • 批准号:
    2411530
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-ANR MCB/PHY: Probing Heterogeneity of Biological Systems by Force Spectroscopy
合作研究:NSF-ANR MCB/PHY:通过力谱探测生物系统的异质性
  • 批准号:
    2412551
  • 财政年份:
    2024
  • 资助金额:
    $ 51.41万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了