III: Small: Bit-Parallel Algorithms for Sequence Alignment and Applications in Detecting Human Genetic Variation and Bacterial Strain Typing

III:小:序列比对的位并行算法及其在检测人类遗传变异和细菌菌株分型中的应用

基本信息

  • 批准号:
    1423022
  • 负责人:
  • 金额:
    $ 56.08万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-10-01 至 2019-09-30
  • 项目状态:
    已结题

项目摘要

This project underscores the close link between the ability to do high throughput sequencing and the wide range of applications that are critical to understanding the biological world. Data analysis is the bottleneck in sequences. This project will lead to new efficiencies in sequence comparison and will lead to a new compendium of genetic variation. This work will provide support for both graduate students and undergraduate students, the latter especially through a new site the PI has established to recruit students from underrepresented groups. The BitPal algorithms will be widely distributed and facility sequence alignment in a variety of areas. The work also directly enhances the infrastructure for research in genomics, while the new protocol will facilitate the epidemiological study of pathogenic infections and analysis of biothreat agents. The deluge of genomic sequence data has outpaced the growing speed of modern computers. For sequence analysis programs, such as VNTRseek, to keep pace with data growth, extremely high efficiency algorithms are required. This project will develop a novel class of bit-parallel alignment algorithms which exploit the inherent parallelism in computer logic operations and will yield dramatic acceleration of sequence comparison tasks. The project will achieve the following: A variety of multi-purpose, high-efficiency bit-parallel alignment algorithms will be designed and implemented for CPU and GPU (graphical processing unit) architectures. A website will be created for easy download and use of the computer code implementing the algorithms. The bit-parallel techniques to be developed are novel and represent an extension of a successful method to a larger class of problems. The algorithms will be widely applicable in bioinformatics and other fields that involve text comparison. Implementation in GPUs will expand the domain of this underutilized computing architecture. The bit-parallel algorithms will be used to replace less efficient algorithms in VNTRseek and TRF, in order to accelerate the analysis of large data sets. Initial analysis will identify VNTRs in 380 human genomes (moderate to high coverage) from the 1000 Genomes Project. Additional genomes will be analyzed as they become available. An online database will be created to store the VNTR data and provide online tools for VNTR analysis. Genome wide occurrence of VNTRs is currently unknown. The VNTRseek analysis of human genomes will result in an entirely new compendium of human genetic variation. A bacterial strain typing protocol will be developed for pathogenic bacteria, based on multilocus VNTR analysis (MLVA), using high-throughput sequencing data as an alternative to slower techniques. This will facilitate the epidemiological study of pathogenic bacterial infrections and the analysis of biothreat agents for national security.
该项目强调了高通量测序能力与对理解生物世界至关重要的广泛应用之间的密切联系。 数据分析是测序的瓶颈。 该项目将导致新的效率在序列比较,并将导致一个新的简编的遗传变异。这项工作将为研究生和本科生提供支持,后者特别是通过PI建立的新网站从代表性不足的群体中招募学生。 Bitmap算法将广泛分布,并在各个领域进行序列比对。 这项工作还直接加强了基因组学研究的基础设施,而新的协议将促进病原体感染的流行病学研究和生物威胁剂的分析。 基因组序列数据的泛滥已经超过了现代计算机的增长速度。对于序列分析程序,如VNTRseek,为了跟上数据增长的步伐,需要极高效率的算法。这个项目将开发一类新的位并行对齐算法,利用计算机逻辑操作中固有的并行性,并将产生显着的加速序列比较任务。 该项目将实现以下目标:将为CPU和GPU(图形处理单元)架构设计和实现各种多用途,高效率的位并行对齐算法。将创建一个网站,方便下载和使用实现算法的计算机代码。要开发的位并行技术是新颖的,代表了一个成功的方法扩展到更大的一类问题。该算法在生物信息学等涉及文本比较的领域具有广泛的应用前景。在GPU中的实现将扩展这种未充分利用的计算架构的领域。位并行算法将被用来取代VNTRseek和TRF中效率较低的算法,以加速大型数据集的分析。初步分析将确定来自1000个基因组计划的380个人类基因组中的VNTR(中到高覆盖率)。其他基因组将在可用时进行分析。将建立一个在线数据库来存储VNTR数据,并为VNTR分析提供在线工具。VNTR的全基因组发生率目前尚不清楚。对人类基因组的VNTRseek分析将产生一个全新的人类遗传变异纲要。将基于多位点VNTR分析(MLVA),使用高通量测序数据作为较慢技术的替代方案,为致病菌开发细菌菌株分型方案。这将有助于病原性细菌感染的流行病学研究和国家安全生物威胁剂的分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Gary Benson其他文献

Evaluating distance functions for clustering tandem repeats.
评估聚类串联重复的距离函数。
Exact Distribution of a Spaced Seed Statistic for DNA Homology Detection
用于 DNA 同源性检测的间隔种子统计量的精确分布
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gary Benson;Denise Y. F. Mak
  • 通讯作者:
    Denise Y. F. Mak
An Alphabet Independent Approach to Two-Dimensional Pattern Matching
一种与字母无关的二维模式匹配方法
  • DOI:
    10.1137/s0097539792226321
  • 发表时间:
    1994
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Amir;Gary Benson;Martín Farach
  • 通讯作者:
    Martín Farach
Minimal entropy probability paths between genome families
基因组家族之间的最小熵概率路径
3'-UTR SIRF: A database for identifying clusters of short interspersed repeats in 3' untranslated regions
  • DOI:
    10.1186/1471-2105-8-274
  • 发表时间:
    2007-07-30
  • 期刊:
  • 影响因子:
    3.300
  • 作者:
    Benjamin B Andken;In Lim;Gary Benson;John J Vincent;Matthew T Ferenc;Bianca Heinrich;Larissa A Jarzylo;Heng-Ye Man;James O Deshler
  • 通讯作者:
    James O Deshler

Gary Benson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Gary Benson', 18)}}的其他基金

REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
  • 批准号:
    1949968
  • 财政年份:
    2020
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
  • 批准号:
    1559829
  • 财政年份:
    2016
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant
III:Small:Algorithms for Tandem Repeat Variant Discovery Using Next Generation Sequencing Data
III:Small:使用下一代测序数据发现串联重复变异的算法
  • 批准号:
    1017621
  • 财政年份:
    2010
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant
IGERT: Integrating Computational Science into Research in Biological Networks
IGERT:将计算科学融入生物网络研究
  • 批准号:
    0654108
  • 财政年份:
    2007
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant
SEI(BIO): DNA Inverted Repeats: Sensitive Detection Methods and Research Database
SEI(BIO):DNA 反向重复:灵敏检测方法和研究数据库
  • 批准号:
    0612153
  • 财政年份:
    2006
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
Composition Patterns in Nucleotide Sequences
核苷酸序列的组成模式
  • 批准号:
    0413463
  • 财政年份:
    2003
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
TRDB: A Multi-genome Database of Tandem Repeats
TRDB:串联重复的多基因组数据库
  • 批准号:
    0413462
  • 财政年份:
    2003
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant
TRDB: A Multi-genome Database of Tandem Repeats
TRDB:串联重复的多基因组数据库
  • 批准号:
    0090789
  • 财政年份:
    2001
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant
Composition Patterns in Nucleotide Sequences
核苷酸序列的组成模式
  • 批准号:
    0073081
  • 财政年份:
    2000
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
CAREER: Tandem Repeats: Sequence Comparison and Search Algorithms
职业:串联重复:序列比较和搜索算法
  • 批准号:
    9623532
  • 财政年份:
    1996
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 56.08万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了