Algorithms for the Analysis of Data from Massively-parallel Genome Sequencing

大规模并行基因组测序数据分析算法

基本信息

  • 批准号:
    0844494
  • 负责人:
  • 金额:
    $ 37.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-04-01 至 2013-03-31
  • 项目状态:
    已结题

项目摘要

New generation DNA sequencing technologies are revolutionizing modern biological research. Scientists can now generate the rough equivalent of an entire human genome (~3 billion base-pairs of DNA) in just a few days with one single sequencing instrument. Until recently, such amounts of data could only be generated at large genome centers using hundreds of sequencers. The analysis of these data is complicated by their size - a single run of a sequencing instrument yields terabytes of information, often requiring a significant scale-up of the existing computational infrastructure. This project is developing parallel algorithms for analyzing new generation sequencing data with a specific focus on the Map-Reduce paradigm implemented on a highly-distributed computing cluster supported by Google and IBM. The project is primarily focused on developing algorithms for sequence alignment and sequence assembly ? critical tasks in the analysis of genomic data ? and involves the adaptation of string matching and graph algorithms to the Map-Reduce paradigm. This work will potentially lead to parallelism-enabled genomic analysis software that will allow researchers to analyze new generation sequencing data through web-scale computational resources, thereby obviating the need for establishing and maintaining a local high-performance computing infrastructure. The software developed during this project is being made available under an open-source license in order to encourage broad use and to enable future research. The research is integrated with teaching and mentoring of graduate and undergraduate students and the results of the work will be disseminated through journal publications and conference presentations.
新一代DNA测序技术正在彻底改变现代生物学研究。 科学家们现在可以在短短几天内用一台测序仪器生成相当于整个人类基因组的粗略数据(约30亿个碱基对的DNA)。直到最近,这样大量的数据只能在大型基因组中心使用数百个测序仪生成。这些数据的分析因其大小而变得复杂-测序仪器的单次运行产生TB的信息,通常需要显着扩大现有的计算基础设施。 该项目正在开发用于分析新一代测序数据的并行算法,特别关注在Google和IBM支持的高度分布式计算集群上实现的Map-Reduce范式。 该项目主要集中于开发序列比对和序列组装的算法。基因组数据分析中的关键任务?并且涉及到字符串匹配和图形算法对Map-Reduce范例的适应。 这项工作将可能导致并行化的基因组分析软件,使研究人员能够通过网络规模的计算资源分析新一代测序数据,从而避免建立和维护本地高性能计算基础设施的需要。 在该项目期间开发的软件将在开放源码许可证下提供,以鼓励广泛使用,并使未来的研究成为可能。该研究与研究生和本科生的教学和指导相结合,工作成果将通过期刊出版物和会议演示文稿传播。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mihai Pop其他文献

De novo likelihood-based measures for comparing metagenomic assemblies
用于比较宏基因组组装的基于从头可能性的测量
GENOME ANNOUNCEMENT Complete Genome Sequence of Aggregatibacter (Haemophilus) aphrophilus NJ8700
基因组公告嗜血杆菌 NJ8700 的完整基因组序列
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Bonaventura;Robert DeSalle;Mihai Pop;Niranjan Nagarajan;D. Figurski;Daniel H. Fine;Jeffrey B. Kaplan;P. Planet
  • 通讯作者:
    P. Planet
A perspective on 16S rRNA operational taxonomic unit clustering using sequence similarity
关于使用序列相似性进行 16S rRNA 操作分类单元聚类的观点
  • DOI:
    10.1038/npjbiofilms.2016.4
  • 发表时间:
    2016-04-20
  • 期刊:
  • 影响因子:
    9.200
  • 作者:
    Nam-Phuong Nguyen;Tandy Warnow;Mihai Pop;Bryan White
  • 通讯作者:
    Bryan White
Microbiota of the Hickey Run Tributary of the Anacostia River
阿纳科斯蒂亚河希基伦支流的微生物群
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Robin Cagle;P. Ramachandran;E. Reed;Seth Commichaux;M. Mammel;D. Lacher;D. Miller;Sabina Lindley;Mihai Pop;Michael C. Bazaco;Beverly J. Wolpert;E. Strain;S. Aker;Joan Feely;A. Ottesen
  • 通讯作者:
    A. Ottesen
Characterization of Two Cryptic Plasmids Isolated in Haiti from Clinical Vibrio cholerae Non-O1/Non-O139
海地临床霍乱弧菌非 O1/非 O139 中分离的两种隐性质粒的表征
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    5.2
  • 作者:
    D. Ceccarelli;Geneviève Garriss;S. Choi;Nur A. Hasan;R. Stepanauskas;Mihai Pop;A. Huq;R. Colwell
  • 通讯作者:
    R. Colwell

Mihai Pop的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mihai Pop', 18)}}的其他基金

REU Site: Undergraduate Bioinformatics Research in Data Science for Genomics
REU 网站:基因组学数据科学本科生生物信息学研究
  • 批准号:
    2149868
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
III: AF: Medium: Collaborative Research: Scalable and Highly Accurate Methods for Metagenomics
III:AF:中:协作研究:可扩展且高度准确的宏基因组学方法
  • 批准号:
    1513615
  • 财政年份:
    2015
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Continuing Grant
III: Small: Genome Assembly Using Sparse Sequence Information
III:小:使用稀疏序列信息进行基因组组装
  • 批准号:
    1117247
  • 财政年份:
    2011
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
III-CXT-Small: Graphs to Diversity: extracting genomic variation from sequence graphs
III-CXT-Small:多样性图表:从序列图中提取基因组变异
  • 批准号:
    0812111
  • 财政年份:
    2008
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Intelligent Patent Analysis for Optimized Technology Stack Selection:Blockchain BusinessRegistry Case Demonstration
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
基于Meta-analysis的新疆棉花灌水增产模型研究
  • 批准号:
    41601604
  • 批准年份:
    2016
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
大规模微阵列数据组的meta-analysis方法研究
  • 批准号:
    31100958
  • 批准年份:
    2011
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
用“后合成核磁共振分析”(retrobiosynthetic NMR analysis)技术阐明青蒿素生物合成途径
  • 批准号:
    30470153
  • 批准年份:
    2004
  • 资助金额:
    22.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2415562
  • 财政年份:
    2023
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2341725
  • 财政年份:
    2023
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212508
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
Large Systems and Big Data: Models, Tools, Analysis, and Algorithms
大型系统和大数据:模型、工具、分析和算法
  • 批准号:
    RGPIN-2020-04075
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Discovery Grants Program - Individual
Learning Transparent models from Data Driven algorithms to Enhance streaming data analysis
从数据驱动算法中学习透明模型以增强流数据分析
  • 批准号:
    2748733
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Studentship
Geometric structures guided learning model and algorithms for bulk RNAseq data analysis
用于批量 RNAseq 数据分析的几何结构引导学习模型和算法
  • 批准号:
    10592460
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212512
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212511
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Standard Grant
Algorithms and Private Data Analysis
算法和私有数据分析
  • 批准号:
    CRC-2020-00004
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Canada Research Chairs
Algorithms and Tools for Big Data Analysis and Automated Real Time Optimal or Near Optimal Decision Making for Industrial Systems
用于工业系统大数据分析和自动实时最佳或接近最佳决策的算法和工具
  • 批准号:
    RGPIN-2017-05785
  • 财政年份:
    2022
  • 资助金额:
    $ 37.99万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了