Global Alignment of Protein Sequences with Position-Specific Scoring Matrices.

蛋白质序列与位置特异性评分矩阵的全局比对。

基本信息

  • 批准号:
    8558118
  • 负责人:
  • 金额:
    $ 6.51万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

NCBI currently uses the local alignment tool "rps-BLAST" to search the CDD. Local alignment tools are inherently inappropriate for CDD retrieval, because complete domains (by definition) are the units conserved in evolution. Thus, retrieval should compare complete domains to protein subsequences, which is "semi-global" alignment. Accordingly, we developed a semi-global alignment algorithm and a novel statistical approximation that discovers whole protein domains within a query protein sequence, thereby giving clues as to the function of novel protein sequences. Simulations show that the approximation is much better than the p-value approximations in other tools like HMMer and rps-BLAST, making GLOBAL a promising candidate for an iterative search tool in protein sequence databases. Dr Sergey Sheetlin implemented our method as a dynamic-programming algorithm in a program called "GLOBAL". Dr Kann analyzed the retrieval efficacy of several competitive methods, including HMMer, an implementation of Hidden Markov models (HMMs), and shown that the retrieval efficacies are in the order: HMMer (in global mode) - about the same as GLOBAL, GLOBAL - better than rps-BLAST. GLOBAL is in fact a degenerate HMM. While retaining HMM retrieval efficacies, GLOBAL is simple enough to be accelerated by the same heuristics used in local alignment methods like BLAST. Accordingly, Dr. Carroll accelerated GLOBAL using the BLAST word-heuristic, speeding it by about an order of magnitude, making its speed competitive with other domain-retrieval tools. He has incorporated the resulting code in the NCBI CoreTools.
NCBI目前使用本地比对工具“rp - blast”来搜索CDD。局部对齐工具本质上不适合CDD检索,因为完整域(根据定义)是进化中保守的单元。因此,检索应该将完整结构域与蛋白质子序列进行比较,这是“半全局”比对。因此,我们开发了一种半全局比对算法和一种新的统计近似方法,可以在查询的蛋白质序列中发现整个蛋白质结构域,从而为新蛋白质序列的功能提供线索。仿真结果表明,该方法比HMMer和rpps - blast等其他工具的p值逼近效果要好得多,使GLOBAL成为蛋白质序列数据库迭代搜索工具的一个有希望的候选工具。Sergey Sheetlin博士在一个名为“GLOBAL”的程序中将我们的方法作为动态规划算法实现。Kann博士分析了几种竞争方法的检索效率,包括hmm,一种隐马尔可夫模型(hmm)的实现,并表明检索效率的顺序是:hmm(在全局模式下)-与global, global大致相同-比rp - blast更好。GLOBAL实际上是一个简并HMM。在保留HMM检索效率的同时,GLOBAL足够简单,可以使用与BLAST等局部对齐方法相同的启发式方法来加速。因此,Carroll博士使用BLAST单词启发式加速了GLOBAL,将其速度提高了大约一个数量级,使其速度与其他领域检索工具相媲美。他已经将结果代码合并到NCBI CoreTools中。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

John Spouge其他文献

John Spouge的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('John Spouge', 18)}}的其他基金

Bioinformatics Studies of Human Viruses
人类病毒的生物信息学研究
  • 批准号:
    10471119
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Taxonomics Methods Using DNA
使用 DNA 的分类学方法
  • 批准号:
    10471121
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Quantitation Of Viral Reproduction
病毒繁殖的定量
  • 批准号:
    7969216
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Statistics and Algorithms in Evolution
进化中的统计和算法
  • 批准号:
    9160939
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
The Statistics of Repeats
重复统计
  • 批准号:
    7735090
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
The Statistics of Repeats
重复统计
  • 批准号:
    7969248
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Analysis of the Performance of Putative Plant Barcodes
假定植物条形码的性能分析
  • 批准号:
    7969250
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Mathematically Rigorous Results In Sequence Matching.
序列匹配中严格的数学结果。
  • 批准号:
    10007523
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Bioinformatics Studies of Human Viruses
人类病毒的生物信息学研究
  • 批准号:
    10007524
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:
Bioinformatics Studies of Human Viruses
人类病毒的生物信息学研究
  • 批准号:
    8558093
  • 财政年份:
  • 资助金额:
    $ 6.51万
  • 项目类别:

相似海外基金

DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Research Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
  • 批准号:
    2337776
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Continuing Grant
CAREER: From Dynamic Algorithms to Fast Optimization and Back
职业:从动态算法到快速优化并返回
  • 批准号:
    2338816
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Continuing Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
  • 批准号:
    2338846
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Continuing Grant
CRII: SaTC: Reliable Hardware Architectures Against Side-Channel Attacks for Post-Quantum Cryptographic Algorithms
CRII:SaTC:针对后量子密码算法的侧通道攻击的可靠硬件架构
  • 批准号:
    2348261
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
  • 批准号:
    2348346
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
  • 批准号:
    2348457
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Standard Grant
EAGER: Search-Accelerated Markov Chain Monte Carlo Algorithms for Bayesian Neural Networks and Trillion-Dimensional Problems
EAGER:贝叶斯神经网络和万亿维问题的搜索加速马尔可夫链蒙特卡罗算法
  • 批准号:
    2404989
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Standard Grant
CAREER: Efficient Algorithms for Modern Computer Architecture
职业:现代计算机架构的高效算法
  • 批准号:
    2339310
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Continuing Grant
CAREER: Improving Real-world Performance of AI Biosignal Algorithms
职业:提高人工智能生物信号算法的实际性能
  • 批准号:
    2339669
  • 财政年份:
    2024
  • 资助金额:
    $ 6.51万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了