BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing

大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言

基本信息

  • 批准号:
    1416259
  • 负责人:
  • 金额:
    $ 123.32万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-08-31 至 2018-12-31
  • 项目状态:
    已结题

项目摘要

The recent emergence of a variety of high-throughput DNA sequencing instrumentation, and the concomitant rapid decline in the cost per base, is causing severe data deluge in all areas of life sciences. The heterogeneity of sequencing instrumentation and the vast diversity of applications enabled by them are creating numerous analytics problems for the bioinformatics community to address. In addition, the conventional serial algorithms that have been the mainstay of bioinformatics research are severely challenged by the ever increasing data sets. The goal of the proposed project is to develop core techniques and software libraries to enable scalable, efficient, high performance computing solutions for high-throughput DNA sequencing, also known as next-generation sequencing (NGS). To empower the larger community, the project seeks to 1) identify a set of core functionalities that frequently occur in many types of high-throughput sequencing applications, 2) develop efficient parallel algorithms and high performance implementations for them, 3) pursue mapping to HPC architectures including clusters, multicores, and GPUs, 4) develop software libraries encapsulating these functionalities with the goal of enabling the bioinformatics community to exploit HPC architectures, and 5) design a domain specific language to enable bioinformatics researchers unfamiliar with parallel processing to benefit from this work through automatic generation of parallel codes. The research will be conducted in the context of challenging problems in human genetics and metagenomics, in collaboration with domain specialists.This project is focused on a key capacity building activity to facilitate pervasive use of parallelism by NGS bioinformatics researchers and practitioners. The goal is to empower the broader community to benefit from clever parallel algorithms, highly tuned implementations, and specialized HPC hardware, without requiring expertise in any of these. The software libraries will be released as open source for use, further development, enhancements, and incorporation by the community. The project will provide opportunities for training postdoctoral and graduate students in bigdata analytics and computer science driven interdisciplinary research. Diverse existing mechanisms at the partner institutions will be leveraged to advance goals of minority and women recruitment, undergraduate participation in research, and K-12 outreach.
最近出现的各种高通量DNA测序仪器,以及随之而来的每碱基成本的快速下降,正在生命科学的所有领域造成严重的数据泛滥。测序仪器的异质性和它们所支持的应用程序的巨大多样性正在为生物信息学社区创造许多分析问题。此外,传统的串行算法一直是生物信息学研究的支柱受到日益增长的数据集的严峻挑战。拟议项目的目标是开发核心技术和软件库,为高通量DNA测序(也称为下一代测序(NGS))提供可扩展、高效、高性能的计算解决方案。为了使更大的社区,该项目寻求1)确定一组经常出现在许多类型的高通量测序应用中的核心功能,2)为其开发高效的并行算法和高性能实现,3)追求到HPC架构的映射,包括集群,多核和GPU,4)开发封装这些功能的软件库,目标是使生物信息学社区能够利用HPC架构,以及5)设计领域特定语言,以使不熟悉并行处理的生物信息学研究人员能够通过自动生成并行代码从这项工作中受益。该研究将在人类遗传学和宏基因组学的挑战性问题的背景下进行,与领域专家合作。该项目的重点是一个关键的能力建设活动,以促进NGS生物信息学研究人员和从业人员普遍使用并行性。其目标是使更广泛的社区能够从智能并行算法、高度优化的实现和专用HPC硬件中受益,而不需要任何这些方面的专业知识。软件库将作为开源发布,供社区使用、进一步开发、增强和合并。该项目将为培养大数据分析和计算机科学驱动的跨学科研究的博士后和研究生提供机会。将利用伙伴机构现有的各种机制,推进少数民族和妇女招聘、本科生参与研究和K-12外联的目标。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Srinivas Aluru其他文献

Reply to: “Re-evaluating the evidence for a universal genetic boundary among microbial species”
回复:“重新评估微生物物种间通用遗传边界的证据”
  • DOI:
    10.1038/s41467-021-24129-1
  • 发表时间:
    2021-07-07
  • 期刊:
  • 影响因子:
    15.700
  • 作者:
    Luis M. Rodriguez-R;Chirag Jain;Roth E. Conrad;Srinivas Aluru;Konstantinos T. Konstantinidis
  • 通讯作者:
    Konstantinos T. Konstantinidis
Distribution-Independent Hierarchical Algorithms for the N-body Problem
  • DOI:
    10.1023/a:1008047806690
  • 发表时间:
    1998-01-01
  • 期刊:
  • 影响因子:
    2.700
  • 作者:
    Srinivas Aluru;John Gustafson;G.M. Prabhu;Fatih E. Sevilgen
  • 通讯作者:
    Fatih E. Sevilgen
A Parallel Monte Carlo Algorithm for Protein Accessible Surface Area Computation
蛋白质可及表面积计算的并行蒙特卡罗算法
  • DOI:
    10.1007/978-3-540-46642-0_49
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Srinivas Aluru;D. Ranjan;N. Futamura
  • 通讯作者:
    N. Futamura

Srinivas Aluru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Srinivas Aluru', 18)}}的其他基金

A scalable integrated multi-modal single cell analysis framework for gene regulatory and cell-cell interaction networks
用于基因调控和细胞间相互作用网络的可扩展集成多模式单细胞分析框架
  • 批准号:
    2233887
  • 财政年份:
    2023
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Continuing Grant
BD Hubs: Collaborative Proposal: SOUTH:The South Big Data Innovation Hub
BD Hubs:合作提案:SOUTH:南方大数据创新中心
  • 批准号:
    1916589
  • 财政年份:
    2019
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Cooperative Agreement
AF: Small: Algorithmic Techniques for High-throughput Analysis of Long Reads
AF:小:长读长高通量分析的算法技术
  • 批准号:
    1816027
  • 财政年份:
    2018
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
EAGER: A Framework for Learning Graph Algorithms with Applications to Social and Gene Networks
EAGER:学习图算法及其在社交和基因网络中的应用的框架
  • 批准号:
    1841351
  • 财政年份:
    2018
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
MRI: Acquisition of an HPC System for Data-Driven Discovery in Computational Astrophysics, Biology, Chemistry, and Materials Science
MRI:获取 HPC 系统,用于计算天体物理学、生物学、化学和材料科学中的数据驱动发现
  • 批准号:
    1828187
  • 财政年份:
    2018
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
Big Data Regional Innovation Hubs and Spokes Workshop
大数据区域创新中心和辐射研讨会
  • 批准号:
    1736154
  • 财政年份:
    2017
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
SHF:Small: Reproducibility and Comprehensive Assessment of Next Generation Sequencing Bioinformatics Software
SHF:Small:下一代测序生物信息学软件的重现性和综合评估
  • 批准号:
    1718479
  • 财政年份:
    2017
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
AF: Medium: Collaborative Research: Sequential and Parallel Algorithms for Approximate Sequence Matching with Applications to Computational Biology
AF:媒介:协作研究:近似序列匹配的顺序和并行算法及其在计算生物学中的应用
  • 批准号:
    1704552
  • 财政年份:
    2017
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
BD Hubs: Collaborative Proposal: SOUTH: A Big Data Innovation Hub for the South Region
BD 中心:合作提案:SOUTH:南部地区的大数据创新中心
  • 批准号:
    1550305
  • 财政年份:
    2015
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
EAGER: Exploratory Research on the Micron Automata Processor
EAGER:微米自动机处理器的探索性研究
  • 批准号:
    1448333
  • 财政年份:
    2014
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant

相似国自然基金

肝细胞Mid 1活化加重脓毒症病理进程的分子机制研究及干预策略优化
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
MID1调控肿瘤相关巨噬细胞细胞中IRF8-STING通路在胶质瘤微环境中的作用机制研究
  • 批准号:
    2025JJ70385
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
E3泛素连接酶Mid1调控Treg细胞影响GVHD 的作用及机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
线粒体动力蛋白MiD51在IL-27诱导类风湿关节炎DN2-B细胞分化扩增中的作用及机制研究
  • 批准号:
    82302047
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MID1调控糖稳态的分子机制
  • 批准号:
    32000815
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
MID1基因缺陷对颅神经嵴细胞的影响及唇腭裂形成的分子病理
  • 批准号:
    2020A151501160
  • 批准年份:
    2020
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
水稻MID1和赤霉素互作调控缺水条件下花粉发育的机制研究
  • 批准号:
    31770352
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于最小重要差异值(MID)的冠心病病证结合疗效评价量表中医临床疗效判定阈值研究
  • 批准号:
    81603504
  • 批准年份:
    2016
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目
层级稀疏化的Mid-Level特征空间下高分辨率遥感影像检索方法研究
  • 批准号:
    41401376
  • 批准年份:
    2014
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
MID器件机电集成数字化设计关键问题的研究
  • 批准号:
    50975241
  • 批准年份:
    2009
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
  • 批准号:
    1560625
  • 财政年份:
    2015
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
  • 批准号:
    1502780
  • 财政年份:
    2014
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
  • 批准号:
    8840914
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
  • 批准号:
    1247469
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Continuing Grant
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
  • 批准号:
    1247726
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: DA : Collaborative Research Big Tensor Mining Theory
BIGDATA:中型:DA:协作研究大张量挖掘理论
  • 批准号:
    8599832
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
  • 批准号:
    8599838
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
  • 批准号:
    1247658
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Continuing Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature.
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析。
  • 批准号:
    1247696
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: DA: ESCE: Collaborative Research: Scalable Statistical Computing for Emerging Omics Data Streams
BIGDATA:中型:DA:ESCE:协作研究:新兴组学数据流的可扩展统计计算
  • 批准号:
    1247813
  • 财政年份:
    2013
  • 资助金额:
    $ 123.32万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了