XPS: FULL: DSD: End-to-end Acceleration of Genomic Workflows on Emerging Heterogeneous Supercomputers

XPS:完整:DSD:新兴异构超级计算机上基因组工作流程的端到端加速

基本信息

  • 批准号:
    1439057
  • 负责人:
  • 金额:
    $ 85万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-09-01 至 2020-02-29
  • 项目状态:
    已结题

项目摘要

The proposed research harnesses parallelism to accelerate thepervasive bioinformatics workflow of detecting genetic variations.This workflow determines the genetic variants present in anindividual, given DNA sequencing data. The variant detection workflowis an integral part of current genomic data analysis, and severalstudies have linked genetic variants to diseases. Typical instancesof this workflow currently take several hours to multiple days tocomplete with state-of-the-art software, and current algorithms andsoftware are unable to exploit and benefit from even modest levels ofhardware parallelism. Most prior approaches to parallelization andperformance tuning of genomic data analysis pipelines have targetedcomputation, I/O, or network data transfer bottlenecks in isolation,and consequently, are limited in the overall performance improvementthey can achieve. This project targets end-to-end accelerationmethodologies and uses emerging heterogeneous supercomputers toreduce workflow time-to-completion.The project focuses on holistic methodologies to accelerate multiplecomponents within the genetic variant detection workflow. It exploreslightweight data reorganizations at multiple granularities to enhancelocality, investigates compute-, communication-, and I/O taskcotuning, locality-aware load-balancing, and coordinated resourcepartitioning to exploit high-performance computing platforms. A keygoal of the proposed research is to design domain-specificoptimizations targeting the massive parallelism and scalabilitypotential of current heterogeneous supercomputers, so that thedeveloped techniques can be easily transferred and applied to dedicated academic cluster and commercial computational environments.Outreach efforts target undergraduate students through recruitingworkshops and attract them to interdisciplinary graduate programs.Curriculum development activities emphasize cross-layer parallelism.For further information, see project web site at http://sites.psu.edu/XPSGenomics
这项拟议的研究利用并行性来加速普遍存在的检测遗传变异的生物信息学工作流。这个工作流确定在给定DNA测序数据的个体中存在的遗传变异。变异检测工作流程是当前基因组数据分析的一个组成部分,一些研究已经将遗传变异与疾病联系起来。这种工作流程的典型实例目前需要几个小时到几天的时间才能使用最先进的软件完成,而当前的算法和软件甚至无法利用和受益于适度的硬件并行性。大多数已有的基因组数据分析流水线并行化和性能调优方法都孤立地针对计算、I/O或网络数据传输瓶颈,因此,它们所能实现的整体性能改进是有限的。该项目的目标是端到端加速方法,并使用新兴的异质超级计算机来缩短工作流完成时间。该项目专注于整体方法来加速遗传变异检测工作流中的多个组件。它探索了多个粒度的轻量级数据重组以增强局部性,研究了计算、通信和I/O任务协调、位置感知负载平衡和协调资源分区以利用高性能计算平台。这项研究的一个主要目标是针对当前异类超级计算机的大规模并行性和可伸缩性设计特定领域的优化,以便开发的技术可以很容易地转移到专门的学术集群和商业计算环境中。推广努力通过招聘研讨会面向本科生,并吸引他们参加跨学科研究生课程。课程开发活动强调跨层并行。有关更多信息,请参见项目网站http://sites.psu.edu/XPSGenomics

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kamesh Madduri其他文献

Accomplishing Approximate FCFS Fairness Without Queues
无队列实现近似FCFS公平
Order or Shuffle: Empirically Evaluating Vertex Order Impact on Parallel Graph Computations
顺序或随机播放:根据经验评估顶点顺序对并行图计算的影响
Kinetic turbulence simulations at extreme scale on leadership-class systems
在领先级系统上进行超大规模的动力学湍流模拟
SPRITE: A Fast Parallel SNP Detection Pipeline
SPRITE:快速并行 SNP 检测流程
  • DOI:
    10.1007/978-3-319-41321-1_9
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Vasudevan Rengasamy;Kamesh Madduri
  • 通讯作者:
    Kamesh Madduri
SNAP (Small-World Network Analysis and Partitioning) Framework
SNAP(小世界网络分析和分区)框架

Kamesh Madduri的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kamesh Madduri', 18)}}的其他基金

Collaborative Research: PPoSS: Planning: Extreme-scale Sparse Data Analytics
协作研究:PPoSS:规划:超大规模稀疏数据分析
  • 批准号:
    2119236
  • 财政年份:
    2021
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
Collaborative Research: CCRI: Planning: A Multilayer Network (MLN) Community Infrastructure for Data, Interaction, Visualization, and Software (MLN-DIVE)
合作研究:CCRI:规划:数据、交互、可视化和软件的多层网络 (MLN) 社区基础设施 (MLN-DIVE)
  • 批准号:
    2120361
  • 财政年份:
    2021
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: NetSplicer: Scalable Decoupling-based Algorithms for Multilayer Network Analysis
合作研究:SHF:中:NetSplicer:用于多层网络分析的可扩展的基于解耦的算法
  • 批准号:
    1955971
  • 财政年份:
    2020
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
CAREER: Algorithmic and Software Foundations for Large-Scale Graph Analysis
职业:大规模图形分析的算法和软件基础
  • 批准号:
    1253881
  • 财政年份:
    2013
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant

相似国自然基金

钴基Full-Heusler合金的掺杂效应和薄膜噪声特性研究
  • 批准号:
    51871067
  • 批准年份:
    2018
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似海外基金

XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1720635
  • 财政年份:
    2016
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: A Parallel Tensor Infrastructure (ParTI!) for Data Analysis
XPS:完整:DSD:用于数据分析的并行张量基础设施 (PartTI!)
  • 批准号:
    1533768
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Parallel Motion Planning for Cloud-connected Robots
XPS:完整:DSD:云连接机器人的并行运动规划
  • 批准号:
    1533844
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1533933
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: FPGA Cloud Platform for Deep Learning, Applications in Computer Vision
XPS:完整:DSD:协作研究:深度学习 FPGA 云平台、计算机视觉应用
  • 批准号:
    1533771
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Scalable High Performance with Halide and Simit Domain Specific Languages
XPS:完整:DSD:使用 Halide 和 Simit 领域特定语言的可扩展高性能
  • 批准号:
    1533753
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1533797
  • 财政年份:
    2015
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Moving the Abyss: Database Management on Future 1000-core Processors
XPS:完整:DSD:协作研究:移动深渊:未来 1000 核处理器上的数据库管理
  • 批准号:
    1438955
  • 财政年份:
    2014
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Rapid Prototyping HPC Environment for Deep Learning
XPS:完整:DSD:协作研究:深度学习的快速原型 HPC 环境
  • 批准号:
    1439052
  • 财政年份:
    2014
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Rapid Prototyping HPC Environment for Deep Learning
XPS:完整:DSD:协作研究:深度学习的快速原型 HPC 环境
  • 批准号:
    1439007
  • 财政年份:
    2014
  • 资助金额:
    $ 85万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了