BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing
大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言
基本信息
- 批准号:1247701
- 负责人:
- 金额:$ 35万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-01-01 至 2017-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The recent emergence of a variety of high-throughput DNA sequencing instrumentation, and the concomitant rapid decline in the cost per base, is causing severe data deluge in all areas of life sciences. The heterogeneity of sequencing instrumentation and the vast diversity of applications enabled by them are creating numerous analytics problems for the bioinformatics community to address. In addition, the conventional serial algorithms that have been the mainstay of bioinformatics research are severely challenged by the ever increasing data sets. The goal of the proposed project is to develop core techniques and software libraries to enable scalable, efficient, high performance computing solutions for high-throughput DNA sequencing, also known as next-generation sequencing (NGS). To empower the larger community, the project seeks to 1) identify a set of core functionalities that frequently occur in many types of high-throughput sequencing applications, 2) develop efficient parallel algorithms and high performance implementations for them, 3) pursue mapping to HPC architectures including clusters, multicores, and GPUs, 4) develop software libraries encapsulating these functionalities with the goal of enabling the bioinformatics community to exploit HPC architectures, and 5) design a domain specific language to enable bioinformatics researchers unfamiliar with parallel processing to benefit from this work through automatic generation of parallel codes. The research will be conducted in the context of challenging problems in human genetics and metagenomics, in collaboration with domain specialists.This project is focused on a key capacity building activity to facilitate pervasive use of parallelism by NGS bioinformatics researchers and practitioners. The goal is to empower the broader community to benefit from clever parallel algorithms, highly tuned implementations, and specialized HPC hardware, without requiring expertise in any of these. The software libraries will be released as open source for use, further development, enhancements, and incorporation by the community. The project will provide opportunities for training postdoctoral and graduate students in bigdata analytics and computer science driven interdisciplinary research. Diverse existing mechanisms at the partner institutions will be leveraged to advance goals of minority and women recruitment, undergraduate participation in research, and K-12 outreach.
最近出现的各种高通量DNA测序仪器,以及随之而来的每碱基成本的快速下降,正在生命科学的所有领域造成严重的数据泛滥。测序仪器的异质性和它们所支持的应用程序的巨大多样性正在为生物信息学社区创造许多分析问题。此外,传统的串行算法一直是生物信息学研究的支柱受到日益增长的数据集的严峻挑战。拟议项目的目标是开发核心技术和软件库,为高通量DNA测序(也称为下一代测序(NGS))提供可扩展、高效、高性能的计算解决方案。为了使更大的社区,该项目寻求1)确定一组经常出现在许多类型的高通量测序应用中的核心功能,2)为其开发高效的并行算法和高性能实现,3)追求到HPC架构的映射,包括集群,多核和GPU,4)开发封装这些功能的软件库,目标是使生物信息学社区能够利用HPC架构,以及5)设计领域特定语言,以使不熟悉并行处理的生物信息学研究人员能够通过自动生成并行代码从这项工作中受益。该研究将在人类遗传学和宏基因组学的挑战性问题的背景下进行,与领域专家合作。该项目的重点是一个关键的能力建设活动,以促进NGS生物信息学研究人员和从业人员普遍使用并行性。其目标是使更广泛的社区能够从智能并行算法、高度优化的实现和专用HPC硬件中受益,而不需要任何这些方面的专业知识。软件库将作为开源发布,供社区使用、进一步开发、增强和合并。该项目将为培养大数据分析和计算机科学驱动的跨学科研究的博士后和研究生提供机会。将利用伙伴机构现有的各种机制,推进少数民族和妇女招聘、本科生参与研究和K-12外联的目标。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Oyekunle Olukotun其他文献
Oyekunle Olukotun的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Oyekunle Olukotun', 18)}}的其他基金
Collaborative Research: CNS Core: Medium: A Stateful Switch Architecture for In-Network Compute
合作研究:CNS Core:Medium:用于网内计算的有状态交换机架构
- 批准号:
2211384 - 财政年份:2022
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
PPoSS: Planning: Eliminating the Bottlenecks to ML Usability and Scalability
PPoSS:规划:消除 ML 可用性和可扩展性的瓶颈
- 批准号:
2028602 - 财政年份:2020
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
RTML: Large: Continuous Adaptation for Decision Streams
RTML:大:决策流的持续适应
- 批准号:
1937301 - 财政年份:2019
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
SHF: Medium: Collaborative Research: From Volume to Velocity: Big Data Analytics in Near-Realtime
SHF:媒介:协作研究:从数量到速度:近实时的大数据分析
- 批准号:
1563078 - 财政年份:2016
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
SHF: Medium: PRISM: Platform for Rapid Investigation of efficient Scientific-computing & Machine-learning
SHF:媒介:PRISM:高效科学计算快速研究平台
- 批准号:
1563113 - 财政年份:2016
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
XPS:DSD:Synthesizing Domain Specific Systems
XPS:DSD:综合领域特定系统
- 批准号:
1337375 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
SHF: Large: Domain Specific Language Infrastructure for Biological Simulation Software
SHF:大型:生物模拟软件的领域特定语言基础设施
- 批准号:
1111943 - 财政年份:2011
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
CSR---AES: Universal Transactions
CSR---AES:通用交易
- 批准号:
0720905 - 财政年份:2007
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
Extending the Limits of Large-Scale Shared Memory Multiprocessors
扩展大规模共享内存多处理器的限制
- 批准号:
0444470 - 财政年份:2004
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
ITR: Prototyping Multithreaded Systems
ITR:多线程系统原型设计
- 批准号:
0220138 - 财政年份:2002
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
相似国自然基金
肝细胞Mid 1活化加重脓毒症病理进程的分子机制研究及干预策略优化
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
MID1调控肿瘤相关巨噬细胞细胞中IRF8-STING通路在胶质瘤微环境中的作用机制研究
- 批准号:2025JJ70385
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
E3泛素连接酶Mid1调控Treg细胞影响GVHD 的作用及机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
线粒体动力蛋白MiD51在IL-27诱导类风湿关节炎DN2-B细胞分化扩增中的作用及机制研究
- 批准号:82302047
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
MID1调控糖稳态的分子机制
- 批准号:32000815
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
MID1基因缺陷对颅神经嵴细胞的影响及唇腭裂形成的分子病理
- 批准号:2020A151501160
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
水稻MID1和赤霉素互作调控缺水条件下花粉发育的机制研究
- 批准号:31770352
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于最小重要差异值(MID)的冠心病病证结合疗效评价量表中医临床疗效判定阈值研究
- 批准号:81603504
- 批准年份:2016
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
层级稀疏化的Mid-Level特征空间下高分辨率遥感影像检索方法研究
- 批准号:41401376
- 批准年份:2014
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
MID器件机电集成数字化设计关键问题的研究
- 批准号:50975241
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
- 批准号:
1560625 - 财政年份:2015
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:
1502780 - 财政年份:2014
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:
8840914 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
- 批准号:
1247469 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
- 批准号:
1247726 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing
大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言
- 批准号:
1416259 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA : Collaborative Research Big Tensor Mining Theory
BIGDATA:中型:DA:协作研究大张量挖掘理论
- 批准号:
8599832 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
- 批准号:
1247658 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature.
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析。
- 批准号:
1247696 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA: ESCE: Collaborative Research: Scalable Statistical Computing for Emerging Omics Data Streams
BIGDATA:中型:DA:ESCE:协作研究:新兴组学数据流的可扩展统计计算
- 批准号:
1247813 - 财政年份:2013
- 资助金额:
$ 35万 - 项目类别:
Standard Grant