Statistics Of Sequence Comparison

序列比较统计

基本信息

项目摘要

This project is a continuing study of questions concerning what similarities can be expected to occur purely by chance when two protein or DNA sequences are compared. A subsidiary and related question concerns the definition of scoring systems that are optimal for distinguishing biologically meaningful patterns from chance similarities. Work this year has focussed on two area. First, we have continued development and implementation of a method to transform an amino acid substitution matrix for use in the comparison of proteins having non-standard amino acid compositions. We have described in detail and implemented a numerical procedure for accomplishing this transformation. The transformation may leave the matrix's relative entropy unconstrained, or it may constrain it to equal a specified value. We have investigated experimentally which approach is best for producing matrices that are sensitive for general purpose database searches. We have found that constraining matrices to have relative entropy near 0.44 nats on average yields the best results. Second, we have studied "standard" and "composition based" statistics for the translated nucleic-acid database search program tblastn. In general, statistics based on standard amino acid compositions yield extremely unreliable E-values, which frequently claim chance alignments to be highly statistically significant. By estimating the "composition" of a database sequence from a window surrounding any given alignment, we are able to scale the substitution matrix so that it yields accurate "composition based" E-values. This procedure has now been implemented in NCBI's version of tblastn.
这个项目是一个持续的研究问题,关于什么相似之处可以预期 当比较两个蛋白质或DNA序列时,一个附属的和相关的问题涉及到评分系统的定义, 有生物学意义的模式。今年的工作重点是 两个地区。 首先,我们继续开发和实施一种方法, 用于比较具有非标准氨基酸的蛋白质的酸取代矩阵 酸组合物。我们已经详细描述并实现了一个数值过程, 完成这一转变。变换可能会留下矩阵的相对熵 不受约束,也可以将其约束为等于指定值。我们已经调查 实验上,哪种方法最适合于产生对一般情况敏感的基质 目的数据库搜索。我们已经发现,约束矩阵具有相对熵 平均接近0.44NAT产生最佳结果。 其次,我们研究了翻译作品的“标准”和“基于成分”的统计数据, 核酸数据库搜索程序tblaetry。一般来说,基于标准氨基酸的统计数据 酸的组成产生极不可靠的E值,它经常声称偶然排列 在统计学上非常重要。通过估计数据库序列的“组成”, 从围绕任何给定比对的窗口,我们能够缩放替换矩阵, 它产生精确的“基于成分的”E值。这一程序现已实施 在NCBI版的tblaetum中

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

STEPHEN F ALTSCHUL其他文献

STEPHEN F ALTSCHUL的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('STEPHEN F ALTSCHUL', 18)}}的其他基金

STATISTICS OF SEQUENCE COMPARISON
序列比较统计
  • 批准号:
    6290478
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Improvements And Extensions To The Blast Algorithms
Blast 算法的改进和扩展
  • 批准号:
    6546809
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Improvements And Extensions To The Blast Algorithms
Blast 算法的改进和扩展
  • 批准号:
    6843572
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics of Sequence Comparison
序列比较统计
  • 批准号:
    9160904
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics of Sequence Comparison
序列比较统计
  • 批准号:
    10007519
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics of Sequence Comparison
序列比较统计
  • 批准号:
    8558094
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics of Sequence Comparison
序列比较统计
  • 批准号:
    8149590
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
IMPROVEMENTS AND EXTENSIONS TO THE BLAST ALGORITHMS
Blast 算法的改进和扩展
  • 批准号:
    6432754
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics Of Sequence Comparison
序列比较统计
  • 批准号:
    6681316
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Statistics of Sequence Comparison
序列比较统计
  • 批准号:
    9555728
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:

相似海外基金

REU Site: Genomics and Computational biology
REU 网站:基因组学和计算生物学
  • 批准号:
    2243206
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
FTMA4 - Computational Biology to facilitate analysis and modulation of the function of intrinsically disordered regions in proteins
FTMA4 - 计算生物学,促进蛋白质本质无序区域功能的分析和调节
  • 批准号:
    BB/X01763X/1
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Training Grant
Predoctoral Training in Bioinformatics and Computational Biology
生物信息学和计算生物学博士前培训
  • 批准号:
    10715126
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
UCLA Pediatric Research Education Program in Bioinformatics, Computational Biology, and Omics
加州大学洛杉矶分校生物信息学、计算生物学和组学儿科研究教育项目
  • 批准号:
    10629061
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
REU Site: A Summer Research Experience in Structural and Computational Biology and Biophysics
REU 网站:结构与计算生物学和生物物理学的夏季研究经历
  • 批准号:
    2150396
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Equipment: MRI: Track 1 Acquisition of a high-performance computer cluster for computational biology
设备: MRI:轨道 1 获取用于计算生物学的高性能计算机集群
  • 批准号:
    2320846
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Core A: Biostatistics and Computational Biology Core
核心A:生物统计学和计算生物学核心
  • 批准号:
    10554475
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Development of Innovative Fat Transplantation Based on Single Cell Analysis and Computational Biology of Subcutaneous Adipose Tissue-Derived Cells
基于皮下脂肪组织来源细胞的单细胞分析和计算生物学的创新脂肪移植的发展
  • 批准号:
    22H03246
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
REU Site: Interdisciplinary Computational Biology (iCompBio)
REU 网站:跨学科计算生物学 (iCompBio)
  • 批准号:
    2149956
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
CSR: Medium: Approximate Membership Query Data Structures in Computational Biology and Storage
CSR:中:计算生物学和存储中的近似成员资格查询数据结构
  • 批准号:
    2317838
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了