A Statistical Learning Framework for Phylogenetic Inference: Information, Uncertainty, and Geometry

系统发育推断的统计学习框架:信息、不确定性和几何

基本信息

  • 批准号:
    1951474
  • 负责人:
  • 金额:
    $ 21.96万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-08-01 至 2024-07-31
  • 项目状态:
    已结题

项目摘要

Phylogenetics, the study of the evolutionary relationships among individuals or groups of organisms from molecular sequence data, is a dominant theme in biological research. In the last few decades, the explosion in the amount of available data for phylogenetic inference has offered great opportunities to further our understanding of various biological processes. At the same time, they also move phylogenetics to a new learning regime, where traditional theories can no longer guide developments and interpretations of phylogenetic algorithms. The main goals of this research are to improve our understanding of the central concepts of phylogenetics through the viewpoints of statistical learning and information theory and to provide essential tools for phylogenetic analyses in this new learning setting. By providing a framework to design, analyze and improve phylogenetic estimators, the research will greatly extend the set of problems for which reliable analyses can be obtained. Most notably, our research in the setting when the number of species increases is especially amenable to the biology of small evolving units, including studies of viruses and antibody-making B-cells. The education component of this study involves mentoring undergraduate and graduate students with independent research in phylogenetics and will produce various demonstrations, tutorials and statistical packages for phylogenetic inference.The proposed research lays out the foundation for explicit quantification of phylogenetic information and uncertainty, with a focus on the setting where sequence data are continually being generated and analyzed. This approach enables the use of local phylogenetic methods as a means to analyze likelihood-based methods and helps investigate systematic ways to stabilize uncertainty while retaining essential information. Two analytical tools to construct and analyze phylogenetic methods in non-asymptotic settings will be developed: a new class of concentration inequalities for evolutionary-related random variables and a Taylor-like local-to-global expansion of phylogenetic likelihood on the space of phylogenetic trees. These newly derived tools will be used to study several important inference problems, including species tree/supertree reconstruction and parameter estimation in viral phylogenetics and trait evolution. The research activities will provide important insights into the influences of phylogenetic information and uncertainty on the stability of a phylogenetic estimate.This award is co-funded with the Statistics program and the Life Science Venture Fund in DMS.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
系统发生学是从分子序列数据研究生物个体或群体之间的进化关系,是生物学研究的主导主题。在过去的几十年里,系统发育推断的可用数据量的爆炸提供了很大的机会,以进一步了解各种生物过程。与此同时,他们还将遗传学转移到一个新的学习机制,传统理论不再能够指导系统发育算法的发展和解释。本研究的主要目标是通过统计学习和信息论的观点来提高我们对遗传学核心概念的理解,并为在这种新的学习环境中进行系统发育分析提供必要的工具。通过提供一个框架来设计,分析和改进系统发育估计,该研究将大大扩展的问题,可以得到可靠的分析。最值得注意的是,在物种数量增加的背景下,我们的研究特别适合于小进化单位的生物学,包括病毒和抗体制造B细胞的研究。本研究的教育部分包括指导本科生和研究生进行系统发育遗传学的独立研究,并将为系统发育推断提供各种演示,教程和统计软件包。拟议的研究为系统发育信息和不确定性的明确量化奠定了基础,重点是序列数据不断生成和分析的环境。这种方法使使用本地系统发育方法作为一种手段来分析基于可能性的方法,并有助于调查系统的方法来稳定的不确定性,同时保留必要的信息。两个分析工具,构建和分析系统发育的方法在非渐近设置将开发:一类新的浓度不平等的进化相关的随机变量和泰勒样的局部到全球的扩展系统发育树的空间上的系统发育的可能性。这些新衍生的工具将被用来研究几个重要的推理问题,包括物种树/超树重建和参数估计在病毒遗传学和性状进化。该研究活动将为系统发育信息和不确定性对系统发育估计稳定性的影响提供重要见解。该奖项由DMS的统计计划和生命科学风险基金共同资助。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
When can we reconstruct the ancestral state? A unified theory
什么时候才能重建祖宗的状态?
  • DOI:
    10.1016/j.tpb.2022.09.001
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    1.4
  • 作者:
    Ho, Lam Si;Dinh, Vu
  • 通讯作者:
    Dinh, Vu
When can we reconstruct the ancestral state? Beyond Brownian motion
什么时候才能重建祖宗的状态?
  • DOI:
    10.1007/s00285-023-01922-8
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    1.9
  • 作者:
    Vu, Nhat L.;Nguyen, Thanh P.;Nguyen, Binh T.;Dinh, Vu;Ho, Lam Si
  • 通讯作者:
    Ho, Lam Si
Convergence of maximum likelihood supertree reconstruction
最大似然超树重建的收敛性
  • DOI:
    10.3934/math.2021513
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    2.2
  • 作者:
    Dinh, Vu;Ho, Lam Si
  • 通讯作者:
    Ho, Lam Si
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Vu Dinh其他文献

Multi-task learning improves ancestral state reconstruction
  • DOI:
    10.1016/j.tpb.2019.01.001
  • 发表时间:
    2019-04-01
  • 期刊:
  • 影响因子:
    1.4
  • 作者:
    Lam Si Tung Ho;Vu Dinh;Nguyen, Cuong, V
  • 通讯作者:
    Nguyen, Cuong, V
CONSISTENCY AND CONVERGENCE RATE OF PHYLOGENETIC INFERENCE VIA REGULARIZATION
  • DOI:
    10.1214/17-aos1592
  • 发表时间:
    2018-08-01
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Vu Dinh;Lam Si Tung Ho;Matsen, Frederick A.
  • 通讯作者:
    Matsen, Frederick A.
Selection vancomycin population pharmacokinetic model for individualized dosing precision based on Bayes approach in adult patients at the Hospital for Tropical Diseases
基于贝叶斯方法在热带病医院成人患者中选择万古霉素群体药代动力学模型以实现个体化给药精度
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Vu Dinh;Nguyen Thi;Cuc;Truong Thuy;Quynh;Lê Đình Văn;Nguyễn Hoàng;Tang Quoc An;Le Dang;Tú Nguyên;Nguyễn Trần;Nam Tiến;H. Phương;Do Ngoc;Tuan;Phương Thảo;Vu Dinh Hoa;N. Cuc;Trương Thúy Quỳnh;Lê Đình Văn;Nguyễn Hoàng;Tăng Quốc;Lê Đặng;Tú Nguyên;Nguyễn Trần;Nam Tiến;H. Phương;Đỗ Ngọc Tuấn;Nguyễn Anh;H. P. Thao;Vu Dinh Hoa
  • 通讯作者:
    Vu Dinh Hoa
A Surrogate Function for One-Dimensional Phylogenetic Likelihoods
  • DOI:
    10.1093/molbev/msx253
  • 发表时间:
    2018-01-01
  • 期刊:
  • 影响因子:
    10.7
  • 作者:
    Claywell, Brian C.;Vu Dinh;Matsen, Frederick A.
  • 通讯作者:
    Matsen, Frederick A.
An active learning framework for set inversion
  • DOI:
    10.1016/j.knosys.2019.104917
  • 发表时间:
    2019-12-01
  • 期刊:
  • 影响因子:
    8.8
  • 作者:
    Nguyen, Binh T.;Nguyen, Duy M.;Vu Dinh
  • 通讯作者:
    Vu Dinh

Vu Dinh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science
揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架
  • 批准号:
    2311064
  • 财政年份:
    2023
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Standard Grant
CAREER: Theory-Guided Statistical Framework for Advancing Learning from Post-Windstorm Engineering Assessments
职业:理论指导的统计框架,促进风暴后工程评估的学习
  • 批准号:
    1944149
  • 财政年份:
    2020
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Standard Grant
CAREER: A Statistical Inferential Framework for Online Learning Algorithms
职业:在线学习算法的统计推理框架
  • 批准号:
    1847415
  • 财政年份:
    2019
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Continuing Grant
Optimization of an Electric Submersible Pump for an Oil Sands Process by Utilizing a Statistical Control Framework which Combines Process Knowledge and Machine Learning
利用结合工艺知识和机器学习的统计控制框架优化油砂工艺用电潜泵
  • 批准号:
    529758-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Canadian Graduate Scholarships Foreign Study Supplements
Examining Implicit Learning Mechanisms within a Statistical Language Learning Framework
在统计语言学习框架内检查内隐学习机制
  • 批准号:
    460422-2014
  • 财政年份:
    2016
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
CAREER: A New Neat Framework for Statistical Machine Learning
职业:统计机器学习的新简洁框架
  • 批准号:
    1661755
  • 财政年份:
    2016
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Continuing Grant
Examining Implicit Learning Mechanisms within a Statistical Language Learning Framework
在统计语言学习框架内检查内隐学习机制
  • 批准号:
    460422-2014
  • 财政年份:
    2015
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Examining Implicit Learning Mechanisms within a Statistical Language Learning Framework
在统计语言学习框架内检查内隐学习机制
  • 批准号:
    460422-2014
  • 财政年份:
    2014
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Building a theoretical and methodological framework for collaborative statistical inference and learning: multi-party and multiphase paradigms
构建协作统计推理和学习的理论和方法框架:多方和多阶段范式
  • 批准号:
    1208799
  • 财政年份:
    2012
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Continuing Grant
CAREER: A New Neat Framework for Statistical Machine Learning
职业:统计机器学习的新简洁框架
  • 批准号:
    1149803
  • 财政年份:
    2012
  • 资助金额:
    $ 21.96万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了