BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing

大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言

基本信息

  • 批准号:
    1247701
  • 负责人:
  • 金额:
    $ 35万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-01-01 至 2017-12-31
  • 项目状态:
    已结题

项目摘要

The recent emergence of a variety of high-throughput DNA sequencing instrumentation, and the concomitant rapid decline in the cost per base, is causing severe data deluge in all areas of life sciences. The heterogeneity of sequencing instrumentation and the vast diversity of applications enabled by them are creating numerous analytics problems for the bioinformatics community to address. In addition, the conventional serial algorithms that have been the mainstay of bioinformatics research are severely challenged by the ever increasing data sets. The goal of the proposed project is to develop core techniques and software libraries to enable scalable, efficient, high performance computing solutions for high-throughput DNA sequencing, also known as next-generation sequencing (NGS). To empower the larger community, the project seeks to 1) identify a set of core functionalities that frequently occur in many types of high-throughput sequencing applications, 2) develop efficient parallel algorithms and high performance implementations for them, 3) pursue mapping to HPC architectures including clusters, multicores, and GPUs, 4) develop software libraries encapsulating these functionalities with the goal of enabling the bioinformatics community to exploit HPC architectures, and 5) design a domain specific language to enable bioinformatics researchers unfamiliar with parallel processing to benefit from this work through automatic generation of parallel codes. The research will be conducted in the context of challenging problems in human genetics and metagenomics, in collaboration with domain specialists.This project is focused on a key capacity building activity to facilitate pervasive use of parallelism by NGS bioinformatics researchers and practitioners. The goal is to empower the broader community to benefit from clever parallel algorithms, highly tuned implementations, and specialized HPC hardware, without requiring expertise in any of these. The software libraries will be released as open source for use, further development, enhancements, and incorporation by the community. The project will provide opportunities for training postdoctoral and graduate students in bigdata analytics and computer science driven interdisciplinary research. Diverse existing mechanisms at the partner institutions will be leveraged to advance goals of minority and women recruitment, undergraduate participation in research, and K-12 outreach.
最近出现了各种高通量DNA测序仪器,以及每个基础成本的迅速下降,在生命科学的所有领域都引起了严重的数据洪水。测序仪器的异质性以及它们启用的大量应用程序正在为生物信息学界创造许多分析问题。此外,由于不断增加的数据集,曾经是生物信息学研究中的主要序列算法受到了严重的挑战。该项目的目标是开发核心技术和软件库,以实现可扩展,高效,高性能计算解决方案的高通量DNA测序,也称为下一代测序(NGS)。为了增强较大的社区的能力,该项目寻求1)确定一组在许多类型的高通量测序应用中经常出现的核心功能,2)为其开发有效的并行算法和高性能实现,3)追求映射到HPC体系结构,包括插图集,Multicores和GPUS,将这些功能与这些功能相关联,4)利用HPC体系结构和5)设计特定的域语言,以使生物信息学研究人员不熟悉并行处理,从而通过自动生成的并行代码从这项工作中受益。这项研究将在与领域专家合作的人类遗传学和宏基因组学中挑战性问题的背景下进行。该项目侧重于关键能力建设活动,以促进NGS生物信息学研究人员和从业者对平行性的普遍使用。目的是使更广泛的社区能够从聪明的并行算法,高度调整的实现和专业的HPC硬件中受益,而无需在任何这些方面都有专业知识。软件库将作为开源,进一步开发,增强和社区合并。该项目将为培训BigData分析和计算机科学驱动的跨学科研究的博士后和研究生提供机会。合作伙伴机构的各种机制将被利用,以促进少数族裔和妇女招募,本科参与研究的目标和K-12外展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Oyekunle Olukotun其他文献

Oyekunle Olukotun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Oyekunle Olukotun', 18)}}的其他基金

Collaborative Research: CNS Core: Medium: A Stateful Switch Architecture for In-Network Compute
合作研究:CNS Core:Medium:用于网内计算的有状态交换机架构
  • 批准号:
    2211384
  • 财政年份:
    2022
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
PPoSS: Planning: Eliminating the Bottlenecks to ML Usability and Scalability
PPoSS:规划:消除 ML 可用性和可扩展性的瓶颈
  • 批准号:
    2028602
  • 财政年份:
    2020
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
RTML: Large: Continuous Adaptation for Decision Streams
RTML:大:决策流的持续适应
  • 批准号:
    1937301
  • 财政年份:
    2019
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
SHF: Medium: Collaborative Research: From Volume to Velocity: Big Data Analytics in Near-Realtime
SHF:媒介:协作研究:从数量到速度:近实时的大数据分析
  • 批准号:
    1563078
  • 财政年份:
    2016
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
SHF: Medium: PRISM: Platform for Rapid Investigation of efficient Scientific-computing & Machine-learning
SHF:媒介:PRISM:高效科学计算快速研究平台
  • 批准号:
    1563113
  • 财政年份:
    2016
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
XPS:DSD:Synthesizing Domain Specific Systems
XPS:DSD:综合领域特定系统
  • 批准号:
    1337375
  • 财政年份:
    2013
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
SHF: Large: Domain Specific Language Infrastructure for Biological Simulation Software
SHF:大型:生物模拟软件的领域特定语言基础设施
  • 批准号:
    1111943
  • 财政年份:
    2011
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
CSR---AES: Universal Transactions
CSR---AES:通用交易
  • 批准号:
    0720905
  • 财政年份:
    2007
  • 资助金额:
    $ 35万
  • 项目类别:
    Continuing Grant
Extending the Limits of Large-Scale Shared Memory Multiprocessors
扩展大规模共享内存多处理器的限制
  • 批准号:
    0444470
  • 财政年份:
    2004
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
ITR: Prototyping Multithreaded Systems
ITR:多线程系统原型设计
  • 批准号:
    0220138
  • 财政年份:
    2002
  • 资助金额:
    $ 35万
  • 项目类别:
    Continuing Grant

相似国自然基金

大规模网络数据中邻接矩阵特征根与特征向量的研究
  • 批准号:
    12371278
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
非凸随机优化在大规模学习任务中的关键参数探究
  • 批准号:
    62302325
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大规模检验中的经验贝叶斯方法
  • 批准号:
    12371282
  • 批准年份:
    2023
  • 资助金额:
    44.00 万元
  • 项目类别:
    面上项目
面向超级计算机的改进粒子群算法在大规模WSN中的应用研究
  • 批准号:
    62372495
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
新型电力系统中可再生能源大规模利用的建模及激励机制研究
  • 批准号:
    72304114
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
  • 批准号:
    1560625
  • 财政年份:
    2015
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
  • 批准号:
    1502780
  • 财政年份:
    2014
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
  • 批准号:
    8840914
  • 财政年份:
    2013
  • 资助金额:
    $ 35万
  • 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
  • 批准号:
    1247469
  • 财政年份:
    2013
  • 资助金额:
    $ 35万
  • 项目类别:
    Continuing Grant
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
  • 批准号:
    1247726
  • 财政年份:
    2013
  • 资助金额:
    $ 35万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了