IIBR Informatics: Advancing Bioinformatics Methods using Ensembles of Profile Hidden Markov Models
IIBR 信息学:使用轮廓隐马尔可夫模型集成推进生物信息学方法
基本信息
- 批准号:2006069
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-08-15 至 2024-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many steps in biological research pipelines involve the use of machine learning models, and these have become standard tools for many basic problems. Elaborations on basic machine learning models ("ensembles" of machine learning models) can provide improvements in accuracy compared to standard usage, for various biological questions. However, the design of these ensembles has been fairly ad hoc, and their use can be computationally intensive, which reduces their appeal in practice. This project will advance this technology by developing statistically rigorous techniques for building ensembles of machine learning models, with the goal of improving accuracy. The project will also develop methods that use these ensembles for new biological problems, including protein structure and function prediction. Broader impacts include software school, engagement with under-represented groups, and open-source software. Profile Hidden Markov Models (i.e., profile HMMs) are probabilistic graphical models that are in wide use in bioinformatics. Research over the last decade has shown that ensembles of profile HMMs (e-HMMs) can provide greater accuracy than a single profile HMM for many applications in bioinformatics, including phylogenetic placement, multiple sequence alignment, and taxonomic identification of metagenomic reads. This project will advance the use of e-HMMs by developing statistically rigorous techniques for building e-HMMs with the goal of improving accuracy and improving understanding of e-HMMs, and will also develop methods that use e-HMMs for protein structure and function prediction. Broader impacts include software schools, engagement with under-represented groups, and open-source software. Project software and papers are available at http://tandy.cs.illinois.edu/eHMMproject.html.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
生物研究管道的许多步骤都涉及机器学习模型的使用,并且这些模型已成为许多基本问题的标准工具。与标准用法相比,针对各种生物学问题,对基本机器学习模型(机器学习模型的“集合”)的详细说明可以提供准确性的改进。但是,这些合奏的设计是相当临时的,它们的使用可以在计算上进行密集,从而降低了他们在实践中的吸引力。该项目将通过开发统计上严格的技术来构建机器学习模型的合奏,以提高准确性来推进这项技术。该项目还将开发使用这些集合来解决新的生物学问题的方法,包括蛋白质结构和功能预测。更广泛的影响包括软件学校,与代表性不足的团体的互动以及开源软件。 配置文件隐藏的马尔可夫模型(即配置文件HMM)是在生物信息学中广泛使用的概率图形模型。 在过去的十年中,研究表明,对于许多在生物信息学中的应用,包括系统发育放置,多个序列比对和元基因组读数的分类学鉴定,概况HMM(E-HMM)的集合可以提供比单个轮廓HMM更高的准确性。该项目将通过开发用于构建E-HMM的统计严格技术来提高E-HMM的使用,以提高准确性并提高对E-HMM的了解,还将开发使用E-HMM的方法来用于蛋白质结构和功能预测。更广泛的影响包括软件学校,与代表性不足的团体的交往以及开源软件。项目软件和论文可在http://tandy.cs.illinois.edu/ehmmproject.html.html..html..html.ins奖中获得,反映了NSF的法定任务,并且认为值得通过基金会的知识分子优点和更广泛的影响审查标准通过评估来进行评估。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Large-Scale Multiple Sequence Alignment and the Maximum Weight Trace Alignment Merging Problem
- DOI:10.1109/tcbb.2022.3191848
- 发表时间:2023-05-01
- 期刊:
- 影响因子:4.5
- 作者:Zaharias,Paul;Smirnov,Vladimir;Warnow,Tandy
- 通讯作者:Warnow,Tandy
WITCH: Improved Multiple Sequence Alignment Through Weighted Consensus Hidden Markov Model Alignment
- DOI:10.1089/cmb.2021.0585
- 发表时间:2022-05-17
- 期刊:
- 影响因子:1.7
- 作者:Shen, Chengze;Park, Minhyuk;Warnow, Tandy
- 通讯作者:Warnow, Tandy
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Tandy Warnow其他文献
½ºº ʹóó×øøòò ×øøòòò¹¹¹××× Ññøøó× ½¹½½
½°º Å11óó×øøòò ×øøòòòòì11××× Ññøøó× ½1½½
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Tandy Warnow - 通讯作者:
Tandy Warnow
Addressing Polymorphism in Linguistic Phylogenetics
解决语言系统发育中的多态性
- DOI:
10.1111/1467-968x.12289 - 发表时间:
2024 - 期刊:
- 影响因子:0.3
- 作者:
Marc E. Canby;Steven N. Evans;Donald Ringe;Tandy Warnow - 通讯作者:
Tandy Warnow
Tandy Warnow的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Tandy Warnow', 18)}}的其他基金
AitF: Full: Collaborative Research: Graph-theoretic algorithms to improve phylogenomic analyses
AitF:完整:协作研究:改进系统发育分析的图论算法
- 批准号:
1535977 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
ABI Innovation: New methods for multiple sequence alignment with improved accuracy and scalability
ABI Innovation:多序列比对的新方法,具有更高的准确性和可扩展性
- 批准号:
1458652 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: AF: Medium: Collaborative Research: Scalable and Highly Accurate Methods for Metagenomics
III:AF:中:协作研究:可扩展且高度准确的宏基因组学方法
- 批准号:
1513629 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
- 批准号:
1461364 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: Novel Methodologies for Genome-scale Evolutionary Analysis of Multi-locus data
合作研究:多位点数据基因组规模进化分析的新方法
- 批准号:
1062335 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: Large-scale simultaneous multiple alignment and phylogeny estimation
合作研究:大规模同时多重比对和系统发育估计
- 批准号:
0733029 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0715370 - 财政年份:2006
- 资助金额:
$ 50万 - 项目类别:
Cooperative Agreement
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0331654 - 财政年份:2003
- 资助金额:
$ 50万 - 项目类别:
Cooperative Agreement
ITR: Collaborative Research, Algorithms for Inferring Reticulate Evolution in Historical Linguistics
ITR:历史语言学中推断网状进化的协作研究和算法
- 批准号:
0312830 - 财政年份:2003
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Information Technology Research (ITR): Building the Tree of Life -- A National Resource for Phyloinformatics and Computational Phylogenetics
信息技术研究(ITR):构建生命之树——系统信息学和计算系统发育学的国家资源
- 批准号:
0331453 - 财政年份:2003
- 资助金额:
$ 50万 - 项目类别:
Cooperative Agreement
相似国自然基金
2023年(第四届)国际生物数学与医学应用研讨会
- 批准号:12342004
- 批准年份:2023
- 资助金额:8.00 万元
- 项目类别:专项项目
突变和修饰重塑蛋白质亚细胞定位的生物信息学研究
- 批准号:32370698
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
知识引导与数据驱动的肝内胆管癌调控关键信号通路识别的信息学模型与应用
- 批准号:32370694
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
基于生物信息学的类风湿性关节炎患者衰弱预测模型的构建与验证
- 批准号:82301786
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于结构表征的蛋白质与长链非编码RNA相互作用预测的生物信息学方法研究
- 批准号:62373216
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
From Analysis to Action: Advancing Health Equity through Learning Health System Research
从分析到行动:通过学习卫生系统研究促进卫生公平
- 批准号:
10753013 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Advancing Medical Illustration in Patient Education Materials: from Art to Science
推进患者教育材料中的医学插图:从艺术到科学
- 批准号:
10660634 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
ComPASS Collective for Community Engagement (C3E)
ComPASS 社区参与集体 (C3E)
- 批准号:
10903370 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Conduits: Mount Sinai Health System Translational Science Hub
管道:西奈山卫生系统转化科学中心
- 批准号:
10702195 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Integration and interoperability of complex data and tissues from the human brain
人脑复杂数据和组织的集成和互操作性
- 批准号:
10789107 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别: