Collaborative Research: ABI Development: A New Platform for highly-optimized, low-latency pipelines for genomic data analysis

协作研究:ABI 开发:用于基因组数据分析的高度优化、低延迟管道的新平台

基本信息

  • 批准号:
    1356486
  • 负责人:
  • 金额:
    $ 52万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-09-15 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

Next-generation sequencing has transformed genomics into a new paradigm of data-intensive computing, raising several salient challenges. First, the deluge of genomic data needs to undergo deep analysis to mine biological information, which requires a full pipeline that integrates many data processing and analysis tools. Second, deep analysis pipelines often take long to run, which entails a long cycle for algorithm and method development. This project aims to bring the latest big data technology and database technology to the genomics domain to revolutionize its data crunching power. This project is anticipated to produce significant scientific and educational benefits. By providing a highly-optimized parallel processing platform for genomic data analysis and making it accessible in private and public clouds, it will enable many new models and algorithms to be developed for genomics and help advance this field at unprecedented speed as big data technology did for Internet companies. This project also integrates research and education with curriculum development, tutorials for K-12 teachers and community college faculty, and engaging women in research through college outreach and NSF-funded outreach programs.The proposed research includes the development of (1) a deep pipeline for genomic data analysis by assembling state-of-the-art methods, (2) automatic parallelization of the workflow using the big data technology, (3) a principled approach to optimizing the genomic pipeline, and (4) integration of streaming technology to reduce latency of important results. The prototype system will be deployed in both private and public cloud environments, and fully evaluated using existing long-running pipelines at the New York Genome Center and in a variety of real use cases. By way of doing so, this project will provide new knowledge regarding how to adapt and advance big data technology, including new optimization, partitioning, and scheduling techniques, for the genomics domain. The results of the project are disseminated at the web site: http://gesall.cs.umass.edu.
下一代测序已经将基因组学转变为数据密集型计算的新范式,提出了几个突出的挑战。首先,海量的基因组数据需要进行深度分析,挖掘生物信息,这需要一个完整的管道,集成了许多数据处理和分析工具。其次,深度分析管道通常需要很长时间才能运行,这需要很长的算法和方法开发周期。该项目旨在将最新的大数据技术和数据库技术引入基因组学领域,以彻底改变其数据处理能力。预计该项目将产生重大的科学和教育效益。通过为基因组数据分析提供高度优化的并行处理平台,并使其可在私有云和公共云中访问,它将使许多新的模型和算法能够为基因组学开发,并帮助以前所未有的速度推进这一领域,就像大数据技术为互联网公司所做的那样。该项目还将研究和教育与课程开发相结合,为K-12教师和社区大学教师提供辅导,并通过大学推广和NSF资助的推广计划吸引女性参与研究。拟议的研究包括:(1)通过组装最先进的方法开发基因组数据分析的深层管道,(2)使用大数据技术自动并行化工作流程,(3)优化基因组流水线的原则性方法,以及(4)整合流技术以减少重要结果的延迟。该原型系统将部署在私有云和公共云环境中,并使用纽约基因组中心现有的长期运行管道和各种真实的用例进行全面评估。通过这样做,该项目将提供有关如何适应和推进大数据技术的新知识,包括新的优化,分区和调度技术,用于基因组学领域。该项目的结果在网站上公布:http://gesall.cs.umass.edu。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yanlei Diao其他文献

Yanlei Diao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yanlei Diao', 18)}}的其他基金

III: Small: High-Performance Complex Processing of Continuous Uncertain Data
三:小:连续不确定数据的高性能复杂处理
  • 批准号:
    1218524
  • 财政年份:
    2012
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
CAREER: Efficient, Robust RFID Stream Processing for Tracking and Monitoring
职业:用于跟踪和监控的高效、稳健的 RFID 流处理
  • 批准号:
    0746939
  • 财政年份:
    2008
  • 资助金额:
    $ 52万
  • 项目类别:
    Continuing Grant
III-COR-Small: Capturing Data Uncertainty in High-Volume Stream Processing
III-COR-Small:捕获大容量流处理中的数据不确定性
  • 批准号:
    0812347
  • 财政年份:
    2008
  • 资助金额:
    $ 52万
  • 项目类别:
    Continuing Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Sustainable ABI: Arctos Sustainability
合作研究:可持续 ABI:Arctos 可持续性
  • 批准号:
    2034568
  • 财政年份:
    2021
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Innovation: FuTRES, an Ontology-Based Functional Trait Resource for Paleo- and Neo-biologists
合作研究:ABI 创新:FuTRES,为古生物学家和新生物学家提供的基于本体的功能性状资源
  • 批准号:
    2201182
  • 财政年份:
    2021
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Development: Symbiota2: Enabling greater collaboration and flexibility for mobilizing biodiversity data
协作研究:ABI 开发:Symbiota2:为调动生物多样性数据提供更大的协作和灵活性
  • 批准号:
    2209978
  • 财政年份:
    2021
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Innovation: Towards Computational Exploration of Large-Scale Neuro-Morphological Datasets
合作研究:ABI 创新:大规模神经形态数据集的计算探索
  • 批准号:
    2028361
  • 财政年份:
    2020
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Innovation: Enabling machine-actionable semantics for comparative analyses of trait evolution
合作研究:ABI 创新:启用机器可操作的语义以进行特征进化的比较分析
  • 批准号:
    2048296
  • 财政年份:
    2020
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Development: Integrated platforms for protein structure and function predictions
合作研究:ABI开发:蛋白质结构和功能预测的集成平台
  • 批准号:
    2021734
  • 财政年份:
    2020
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Innovation: Biofilm Resource and Information Database (BRaID): A Tool to Fuse Diverse Biofilm Data Types
合作研究:ABI 创新:生物膜资源和信息数据库 (BRaID):融合多种生物膜数据类型的工具
  • 批准号:
    2027203
  • 财政年份:
    2019
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO Collaborative Research: ABI Development: A Critical Assessment of Protein Function Annotation
BBSRC-NSF/BIO 双边合作研究:ABI 开发:蛋白质功能注释的批判性评估
  • 批准号:
    1854685
  • 财政年份:
    2018
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
Collaborative Research: ABI Development: Building a Pipeline for Validation, Curation and Archiving of Integrative/Hybrid Models
合作研究:ABI 开发:构建集成/混合模型的验证、管理和归档管道
  • 批准号:
    1756250
  • 财政年份:
    2018
  • 资助金额:
    $ 52万
  • 项目类别:
    Continuing Grant
Collaborative Research: ABI Development: The next stage in protein-protein docking
合作研究:ABI 开发:蛋白质-蛋白质对接的下一阶段
  • 批准号:
    1759472
  • 财政年份:
    2018
  • 资助金额:
    $ 52万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了