ABI Innovation: New methods for multiple sequence alignment with improved accuracy and scalability
ABI Innovation:多序列比对的新方法,具有更高的准确性和可扩展性
基本信息
- 批准号:1458652
- 负责人:
- 金额:$ 86.16万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-08-15 至 2021-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Multiple sequence alignment (MSA) is one of the most basic bioinformatics steps, in which a set of molecular sequences (i.e., DNA, RNA, or amino acid sequences) are arranged inside a matrix to identify corresponding positions. MSA calculation is a fundamental first step in many biological analyses. Because of its broad applicability and importance, many MSA methods have been developed and are in wide use today. Unfortunately, many real world biological datasets have features (large size and fragmentary sequences, for example) that make accurate MSA calculation very difficult. Because poorly estimated alignments result in errors in downstream biological analyses, new MSA techniques are needed that can produce accurate alignments on difficult datasets. This project will develop MSA methods with greatly improved accuracy, and that can analyze the large and heterogeneous sequence datasets being assembled in different biology projects nationally. The project also has a substantial outreach component to women's colleges and minority serving institutions, and summer software schools to train biologists in the use of the project software.Multiple sequence alignment (MSA) and phylogeny estimation are two very basic bioinformatics problems, which sit at the intersection of machine learning, statistical estimation, and evolutionary and structural biology. MSA has particular importance in constructing evolutionary trees, understanding the function and structure of proteins, detecting interactions between proteins, and even genome assembly. Large-scale MSA and phylogeny estimation also require high performance computing and parallel algorithms, in order to provide adequate scalability. The team will develop new machine learning techniques to greatly improve MSA methods, and hence also phylogeny estimation, since it depends on accurate multiple sequence alignments. The core of this project is algorithm development, utilizing a variety of machine learning techniques (including Hidden Markov Models), statistical estimation methods (especially Bayesian MCMC and maximum likelihood), and novel algorithmic strategies, all focused on improving scalability and accuracy. More information about the project can be found at: http://tandy.cs.illinois.edu/MSAproject.html
多序列比对(MSA)是最基本的生物信息学步骤之一,其中一组分子序列(即DNA,RNA或氨基酸序列)在矩阵内布置以识别相应的位置。 MSA计算是许多生物学分析的基本第一步。由于其广泛的适用性和重要性,因此已经开发了许多MSA方法,并已广泛使用。 不幸的是,许多现实世界的生物数据集具有使MSA计算非常困难的功能(例如,大尺寸和碎片序列)。 由于估计较差的对准会导致下游生物学分析中的错误,因此需要新的MSA技术来在困难数据集上产生准确的比对。该项目将以大大提高准确性开发MSA方法,这可以分析在全国范围内不同的生物学项目中组装的大型且异质的序列数据集。该项目还针对女性大学和少数族裔服务机构以及夏季软件学校培训生物学家使用项目软件。多种序列序列对准(MSA)和系统发育估计是两个非常基本的生物信息信息问题,它们位于机器学习,统计估算,统计学估计,统计学,进化和结构生物学和结构。 MSA在构造进化树,了解蛋白质的功能和结构,检测蛋白质之间的相互作用甚至基因组组装方面特别重要。大规模的MSA和系统发育估计还需要高性能计算和平行算法,以提供足够的可伸缩性。该团队将开发新的机器学习技术以极大地改善MSA方法,因此还会进行系统发育估计,因为它取决于准确的多个序列比对。该项目的核心是算法开发,利用各种机器学习技术(包括隐藏的马尔可夫模型),统计估计方法(尤其是贝叶斯MCMC和最大似然)以及新颖的算法策略,都集中在提高可扩展性和准确性上。有关该项目的更多信息,请访问:http://tandy.cs.illinois.edu/msaproject.html
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Tandy Warnow其他文献
½ºº ʹóó×øøòò ×øøòòò¹¹¹××× Ññøøó× ½¹½½
½°º Å11óó×øøòò ×øøòòòòì11××× Ññøøó× ½1½½
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Tandy Warnow - 通讯作者:
Tandy Warnow
Addressing Polymorphism in Linguistic Phylogenetics
解决语言系统发育中的多态性
- DOI:
10.1111/1467-968x.12289 - 发表时间:
2024 - 期刊:
- 影响因子:0.3
- 作者:
Marc E. Canby;Steven N. Evans;Donald Ringe;Tandy Warnow - 通讯作者:
Tandy Warnow
Tandy Warnow的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Tandy Warnow', 18)}}的其他基金
IIBR Informatics: Advancing Bioinformatics Methods using Ensembles of Profile Hidden Markov Models
IIBR 信息学:使用轮廓隐马尔可夫模型集成推进生物信息学方法
- 批准号:
2006069 - 财政年份:2020
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
AitF: Full: Collaborative Research: Graph-theoretic algorithms to improve phylogenomic analyses
AitF:完整:协作研究:改进系统发育分析的图论算法
- 批准号:
1535977 - 财政年份:2015
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
III: AF: Medium: Collaborative Research: Scalable and Highly Accurate Methods for Metagenomics
III:AF:中:协作研究:可扩展且高度准确的宏基因组学方法
- 批准号:
1513629 - 财政年份:2015
- 资助金额:
$ 86.16万 - 项目类别:
Continuing Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
- 批准号:
1461364 - 财政年份:2014
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
- 批准号:
1062335 - 财政年份:2011
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
Collaborative Research: Large-scale simultaneous multiple alignment and phylogeny estimation
合作研究:大规模同时多重比对和系统发育估计
- 批准号:
0733029 - 财政年份:2007
- 资助金额:
$ 86.16万 - 项目类别:
Continuing Grant
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0715370 - 财政年份:2006
- 资助金额:
$ 86.16万 - 项目类别:
Cooperative Agreement
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0331654 - 财政年份:2003
- 资助金额:
$ 86.16万 - 项目类别:
Cooperative Agreement
ITR: Collaborative Research, Algorithms for Inferring Reticulate Evolution in Historical Linguistics
ITR:历史语言学中推断网状进化的协作研究和算法
- 批准号:
0312830 - 财政年份:2003
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0331453 - 财政年份:2003
- 资助金额:
$ 86.16万 - 项目类别:
Cooperative Agreement
相似国自然基金
甜菊糖苷新位点糖基化的机制研究及其在低热量甜味剂结构创新中的应用
- 批准号:32372277
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
3链适配的数字化转型赋能新零售商业模式生态化创新机制研究
- 批准号:72362029
- 批准年份:2023
- 资助金额:27 万元
- 项目类别:地区科学基金项目
新《种子法》知识产权保护对种子企业技术创新行为的影响机理研究:外部性视角
- 批准号:72173053
- 批准年份:2021
- 资助金额:48 万元
- 项目类别:面上项目
基于神经炎症失调的抑郁症治疗新靶标星型胶质细胞缝隙连接功能的确证与创新药物发现
- 批准号:82130109
- 批准年份:2021
- 资助金额:290 万元
- 项目类别:重点项目
N-Myc异常激活的神经母细胞瘤药物新靶点发现和创新药物研究
- 批准号:
- 批准年份:2020
- 资助金额:260 万元
- 项目类别:联合基金项目
相似海外基金
ABI Innovation: Taxonomically intelligent data integration for a new Flora of Alaska
ABI 创新:阿拉斯加新植物区系的分类智能数据集成
- 批准号:
1759964 - 财政年份:2018
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
ABI Innovation: A New Automated Data Integration, Annotations, and Interaction Network Inference System for Analyzing Drosophila Gene Expression
ABI Innovation:用于分析果蝇基因表达的新型自动化数据集成、注释和交互网络推理系统
- 批准号:
1836866 - 财政年份:2017
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
ABI Innovation: New Software Tools for Genome Comparisons of Non-Model Organisms
ABI Innovation:用于非模式生物基因组比较的新软件工具
- 批准号:
1619983 - 财政年份:2016
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
ABI Innovation: A New Framework to Analyze Plant Energy-related Phenomics Data
ABI Innovation:分析植物能量相关表型组数据的新框架
- 批准号:
1716340 - 财政年份:2016
- 资助金额:
$ 86.16万 - 项目类别:
Standard Grant
ABI Innovation: New Algorithms for Biological X-ray Free Electron Laser Data
ABI Innovation:生物 X 射线自由电子激光数据的新算法
- 批准号:
1565180 - 财政年份:2016
- 资助金额:
$ 86.16万 - 项目类别:
Continuing Grant