Statistics of Sequence Comparison
序列比较统计
基本信息
- 批准号:8149590
- 负责人:
- 金额:$ 39.17万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:
- 资助国家:美国
- 起止时间:至
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Work this year focused on scoring systems for multiple
alignment. Most pairwise and multiple sequence alignment
programs seek alignments with optimal scores. Central to
defining such scores is selecting a set of substitution
scores for aligned amino acids or nucleotides. Substitution
scores for local pairwise alignment are implicitly of
log-odds form, comparing the probabilities of aligning
two letters under models of relatedness and non-relatedness,
and the best pairwise substitution scores are explicitly
so constructed. We have developed ideas, based on the
minimum description length principle, for extending this
formalism to multiple alignments. Most simply, Bayesian
methods can be used to derive "BILD" substitution scores
from prior distributions describing columns of related
letters. This approach has been used previously only
to define scores for aligning individual sequences to
sequence profiles, but it has much broader applicability.
We have employed BILD scores in Gibbs sampling
optimization procedures, and shown that they yield
improved performance in constructing biologically
accurate alignments. We have developed pilot programs
for constructing gapped multiple alignments using BILD
scores. Using artificial sequences, we have shown these
programs to have superior performance to earlier programs
at detecting domain boundaries. We have also appled them
to the recognition and annotation of DNA-binding domains
in Apicomplexan proteins.
In related work, we have studied Dirichlet mixture models
in the context of non-standard sequence composition. A
Dirichlet mixture with M components over an alphabet of
L letters has M*(L+1)-1 free parameters. If M = L/2, this
is exactly as many as a symmetric pairwise substitution
matrix. While each Dirichlet mixture implies a unique
such matrix, we have shown that multiple mixtures can map
to the same matrix, and some substitution matrices may not
correspond to any Dirichlet mixture. A Dirichlet mixture
for protein sequence analysis generally is constructed
from a particular set of proteins, implying a particular
background amino acid composition. The mixture should
be non-optimal for the comparison of proteins with
significantly different composition. We have described
a sensible and efficient method for adjusting the
parameters of a Dirichlet mixture so that they are
consistent with any specified composition.
今年的工作重点是多个评分系统
结盟。 大多数成对和多序列比对
程序寻求与最佳分数的一致性。 中央至
定义这样的分数是选择一组替换
比对的氨基酸或核苷酸的分数。 替代
局部成对比对的分数隐式为
对数赔率形式,比较对齐的概率
相关性和非相关性模型下的两个字母,
最好的成对替换分数是明确的
如此构建。 我们开发了一些想法,基于
最小描述长度原则,用于扩展此
形式主义到多重对齐。 最简单的是,贝叶斯
方法可用于导出“BILD”替代分数
来自描述相关列的先验分布
字母。 这种方法以前只用过
定义将各个序列对齐的分数
序列概况,但它具有更广泛的适用性。
我们在吉布斯抽样中采用了 BILD 分数
优化程序,并表明它们产生
提高生物构建的性能
准确的对齐。 我们制定了试点计划
使用 BILD 构建缺口多重比对
分数。 使用人工序列,我们已经展示了这些
程序具有比早期程序更优越的性能
在检测域边界时。 我们也应用了它们
DNA 结合域的识别和注释
存在于顶复门蛋白中。
在相关工作中,我们研究了狄利克雷混合模型
在非标准序列组成的背景下。 一个
在字母表上具有 M 个分量的狄利克雷混合物
L 字母有 M*(L+1)-1 个自由参数。 如果 M = L/2,则
与对称成对替换一样多
矩阵。 虽然每个狄利克雷混合物都意味着一个独特的
这样的矩阵,我们已经证明多种混合物可以映射
到同一个矩阵,并且某些替换矩阵可能不会
对应于任何狄利克雷混合物。 狄利克雷混合物
用于蛋白质序列分析的一般构建
来自一组特定的蛋白质,意味着特定的
背景氨基酸组成。 该混合物应
对于蛋白质的比较来说不是最佳的
组成显着不同。 我们已经描述过
一种合理有效的调整方法
狄利克雷混合物的参数,使得它们是
与任何指定的成分一致。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
STEPHEN F ALTSCHUL其他文献
STEPHEN F ALTSCHUL的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('STEPHEN F ALTSCHUL', 18)}}的其他基金
Improvements And Extensions To The Blast Algorithms
Blast 算法的改进和扩展
- 批准号:
6546809 - 财政年份:
- 资助金额:
$ 39.17万 - 项目类别:
Improvements And Extensions To The Blast Algorithms
Blast 算法的改进和扩展
- 批准号:
6843572 - 财政年份:
- 资助金额:
$ 39.17万 - 项目类别:
IMPROVEMENTS AND EXTENSIONS TO THE BLAST ALGORITHMS
Blast 算法的改进和扩展
- 批准号:
6432754 - 财政年份:
- 资助金额:
$ 39.17万 - 项目类别:
Improvements and Extensions to the BLAST Algorithms
BLAST 算法的改进和扩展
- 批准号:
9555732 - 财政年份:
- 资助金额:
$ 39.17万 - 项目类别:
相似国自然基金
时空分辨核酸生物传感在亚细胞水平光电双模态精准测量
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
水凝胶改性陶瓷人工关节牢固结合界面的构筑与减磨润滑机理研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
锆酸铅基反铁电体畴动力学及其调控机理研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
USP7维持FADS2蛋白质稳态调控线粒体重编程驱动三阴性乳腺癌的转移
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
载铁生物炭对土壤镉污染的吸附固定及微生物协同作用机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
SREBP转录因子BbSre1负调控球孢白僵菌抗真菌物质产生的机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向截肢患者运动感知重建的肌电假肢手关节运动反馈时变编码研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
载鸢尾素层层自组装二氧化钛纳米管材料促进糖尿病骨缺损修复及机制研
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多源数据融合的内外激励耦合下电驱动系统非平稳非高斯服役载荷谱高保
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向水质应急快检的碳点/微流控限域增强发光传感研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
REU Site: DRUMS Directed Research for Undergraduates in Math and Statistics
REU 网站:DRUMS 为数学和统计学本科生指导的研究
- 批准号:
2349611 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Continuing Grant
Conference: Theory and Foundations of Statistics in the Era of Big Data
会议:大数据时代的统计学理论与基础
- 批准号:
2403813 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Standard Grant
TRACK-UK: Synthesized Census and Small Area Statistics for Transport and Energy
TRACK-UK:交通和能源综合人口普查和小区域统计
- 批准号:
ES/Z50290X/1 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Research Grant
The neural underpinnings of speech and nonspeech auditory processing in autism: Implications for language
自闭症患者言语和非言语听觉处理的神经基础:对语言的影响
- 批准号:
10827051 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Computational Statistics to Tackle Modern Slavery
解决现代奴隶制问题的计算统计
- 批准号:
MR/X034992/1 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Fellowship
Understanding spectral statistics and dynamics in strongly-interacting quantum many-body systems
了解强相互作用量子多体系统中的光谱统计和动力学
- 批准号:
EP/X042812/1 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Fellowship
CAREER: Strengthening the Theoretical Foundations of Federated Learning: Utilizing Underlying Data Statistics in Mitigating Heterogeneity and Client Faults
职业:加强联邦学习的理论基础:利用底层数据统计来减轻异构性和客户端故障
- 批准号:
2340482 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Continuing Grant
MRC International Statistics & Epidemiology Partnership (ISEP): Strengthening capacity in applied medical statisticians in sub-Saharan Africa
MRC国际统计
- 批准号:
MR/X019888/1 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Research Grant
Conference: Statistics in the Age of AI
会议:人工智能时代的统计
- 批准号:
2349991 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Standard Grant
Conference: The 2024 Joint Research Conference on Statistics in Quality, Industry, and Technology (JRC 2024) - Data Science and Statistics for Industrial Innovation
会议:2024年质量、工业和技术统计联合研究会议(JRC 2024)——数据科学与统计促进产业创新
- 批准号:
2404998 - 财政年份:2024
- 资助金额:
$ 39.17万 - 项目类别:
Standard Grant