III: Small: Graph Generative Deep Learning for Protein Structure Prediction

III:小:用于蛋白质结构预测的图生成深度学习

基本信息

  • 批准号:
    2110926
  • 负责人:
  • 金额:
    $ 49.98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

Decades of scientific enquiry beyond molecular biology have demonstrated just how fundamental form is to function, whether in understanding phase transitions in statistical physics, predicting the evolution and dynamics of real networks in network science, or successfully steering an articulated robot arm to a target pose. A fundamental question in all these scientific domains is how to effectively explore the space of all possible forms of a dynamic system to uncover those that satisfy non-trivial constraints imposed by function. The most visible instantiation of this question in computational structural biology is de-novo protein structure prediction (PSP). PSP takes a structure-driven view of understanding molecular mechanisms in the cell and seeks to determine one or more biologically-active/native structures of a protein from knowledge of its chemical composition. Elucidating such structures is central to inferring the biological activities of a rapidly-growing number of protein-encoding gene sequences and thus advancing our understanding of the inner workings of a cell. While PSP has a natural formulation under stochastic optimization, current efforts are approaching a saturation point. This project proposes a radically-different, complementary approach. Inspired by recent momentum in generative deep learning, the project approaches de-novo PSP under the umbrella of generative, adversarial deep learning. The approach is firmly grounded in information integration and informatics, as it proposes generative models that learn in an adversarial setting to generate native-like tertiary protein structures. The project benefits researchers in machine learning, deep learning, and information integration with interests in graph generative models, molecule generation, and protein structure prediction. The project will result in open-source codes, online teaching modules and tutorials, publicly-available data and models, workshops, software demos, and will broaden the participation in computing of under-represented students.The activities in this project chart a new algorithmic path under the umbrella of information integration and informatics to address the current impasse in structure-function related problems in molecular biology. The focus is on the de-novo protein structure prediction problem. With experimental structure determination lagging behind the rapidly-growing number of protein-encoding gene sequences by high-throughput sequencing technologies, computational approaches have a central role in molecular biology research. Great progress has been made through stochastic optimization, but current approaches are experiencing diminishing returns, partly due to fundamental challenges concerning the resource-aware exploration-exploitation control in complex search spaces and inherently inaccurate scoring functions. This project puts forth a novel approach to structure prediction under the umbrella of generative, adversarial deep learning, leveraging recent advances and opportunities in graph generative learning, adversarial learning, and deep learning. Generative models learn in an adversarial setting to generate native-like tertiary protein structures. The proposed activities span multiple disciplines and promise to make general contributions in machine learning, deep learning, explainable AI, molecular modeling, and computational biology. The work will also benefit researchers and students interested in modeling complex, dynamic systems. The investigators will disseminate the proposed research via open-source codes in C++ and Python so as to reach diverse communities of researchers and students, online teaching modules and tutorials, trained models and data. They will actively educate involved communities through workshops, tutorials, and software demonstrations. This interdisciplinary project also creates excellent opportunities to broaden the participation in computing of under-represented students of all backgrounds.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
几十年来,分子生物学之外的科学探索已经证明了形式对功能的重要性,无论是在统计物理学中理解相变,在网络科学中预测真实的网络的演化和动力学,还是成功地将关节式机器人手臂转向目标姿势。所有这些科学领域的一个基本问题是如何有效地探索空间的所有可能的形式的动态系统,发现那些满足非平凡的约束所施加的功能。 这个问题在计算结构生物学中最明显的实例是从头蛋白质结构预测(PSP)。PSP采用结构驱动的观点来理解细胞中的分子机制,并试图从其化学组成的知识中确定蛋白质的一个或多个生物活性/天然结构。阐明这些结构对于推断快速增长的蛋白质编码基因序列的生物活性至关重要,从而促进我们对细胞内部运作的理解。虽然PSP在随机优化下有一个自然的公式,但目前的努力正在接近饱和点。该项目提出了一种完全不同的互补方法。受生成式深度学习的最新发展势头的启发,该项目在生成式对抗式深度学习的保护伞下重新处理PSP。该方法牢固地建立在信息集成和信息学的基础上,因为它提出了在对抗环境中学习以生成类似天然的三级蛋白质结构的生成模型。该项目有利于机器学习,深度学习和信息集成的研究人员,他们对图形生成模型,分子生成和蛋白质结构预测感兴趣。该项目将产生开源代码、在线教学模块和教程、公开数据和模型、研讨会、软件演示,并将扩大代表性不足的学生对计算的参与。该项目的活动在信息集成和信息学的保护伞下绘制了一条新的算法路径,以解决当前分子生物学中结构-功能相关问题的僵局。重点是从头蛋白质结构预测问题。 随着高通量测序技术对蛋白质编码基因序列数量的快速增长,实验结构的确定滞后于此,计算方法在分子生物学研究中发挥着核心作用。通过随机优化已经取得了很大的进展,但目前的方法正在经历收益递减,部分原因是复杂搜索空间中的资源感知探索-开发控制和固有的不准确评分函数的基本挑战。该项目提出了一种新的方法,在生成,对抗深度学习的保护伞下进行结构预测,利用图生成学习,对抗学习和深度学习的最新进展和机会。生成模型在对抗环境中学习,以生成类似天然的三级蛋白质结构。拟议的活动跨越多个学科,并有望在机器学习、深度学习、可解释人工智能、分子建模和计算生物学方面做出普遍贡献。这项工作也将有利于对复杂动态系统建模感兴趣的研究人员和学生。研究人员将通过C++和Python的开源代码传播拟议的研究,以便接触到不同的研究人员和学生社区,在线教学模块和教程,经过训练的模型和数据。他们将通过研讨会、教程和软件演示积极教育相关社区。这个跨学科的项目也创造了很好的机会,以扩大参与计算的代表性不足的学生的所有background.This奖项反映了NSF的法定使命,并已被认为是值得的支持,通过评估使用基金会的智力价值和更广泛的影响审查标准。

项目成果

期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Disentangled Spatiotemporal Graph Generative Models
解缠结的时空图生成模型
Small molecule generation via disentangled representation learning
  • DOI:
    10.1093/bioinformatics/btac296
  • 发表时间:
    2022-05
  • 期刊:
  • 影响因子:
    5.8
  • 作者:
    Yuanqi Du;Xiaojie Guo;Yinkai Wang;Amarda Shehu;Liang Zhao
  • 通讯作者:
    Yuanqi Du;Xiaojie Guo;Yinkai Wang;Amarda Shehu;Liang Zhao
Accelerated Gradient-free Neural Network Training by Multi-convex Alternating Optimization
  • DOI:
    10.1016/j.neucom.2022.02.039
  • 发表时间:
    2018-11
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Junxiang Wang;Fuxun Yu;Xiangyi Chen;Liang Zhao
  • 通讯作者:
    Junxiang Wang;Fuxun Yu;Xiangyi Chen;Liang Zhao
A Systematic Survey on Deep Generative Models for Graph Generation
Adaptive Kernel Graph Neural Network
  • DOI:
    10.1609/aaai.v36i6.20664
  • 发表时间:
    2021-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mingxuan Ju;Shifu Hou;Yujie Fan;Jianan Zhao;Liang Zhao;Yanfang Ye
  • 通讯作者:
    Mingxuan Ju;Shifu Hou;Yujie Fan;Jianan Zhao;Liang Zhao;Yanfang Ye
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Liang Zhao其他文献

Novel imidazolium stationary phase for high-performance liquid chromatography.
用于高效液相色谱的新型咪唑固定相。
  • DOI:
    10.1016/j.chroma.2006.03.016
  • 发表时间:
    2006-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hongdeng Qiu;Shengxiang Jiang;Xia Liu*;Liang Zhao
  • 通讯作者:
    Liang Zhao
The QUENDA-BOT: Autonomous Robot for Screw-Fixing Installation in Timber Building Construction
QUENDA-BOT:木结构建筑中用于螺钉固定安装的自主机器人
Phenotypic effects of the nurse Thylacospermum caespitosum on dependent plant species along regional climate stress gradients
沿区域气候胁迫梯度,袋囊草保育员对依赖植物物种的表型影响
  • DOI:
    10.1111/oik.04512
  • 发表时间:
    2018-02
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Xingpei Jiang;Richard Michalet;Shuyan Chen;Liang Zhao;Xiangtai Wang;Chenyue Wang;Lizhe An;Sa Xiao
  • 通讯作者:
    Sa Xiao
Interannual variability of dimethylsulfide in the Yellow Sea
黄海二甲硫醚的年际变化
  • DOI:
    10.1007/s00343-020-0480-0
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Sijia Wang;Qun Sun;Shuai Li;Jiawei Shen;Qian Liu;Liang Zhao
  • 通讯作者:
    Liang Zhao
Tape-Assisted Photolithographic-Free Microfluidic Chip Cell Patterning for Tumor Metastasis Study
用于肿瘤转移研究的胶带辅助免光刻微流控芯片细胞图案化
  • DOI:
    10.1021/acs.analchem.7b03225
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    7.4
  • 作者:
    Liang Zhao;Tengfei Guo;Lirong Wang;Yang Liu;Ganyu Chen;Hao Zhou;Meiqin Zhang
  • 通讯作者:
    Meiqin Zhang

Liang Zhao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Liang Zhao', 18)}}的其他基金

Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403312
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Uncovering Solar Wind Composition, Acceleration, and Origin through Observations, Modeling, and Machine Learning Methods
职业:通过观测、建模和机器学习方法揭示太阳风的成分、加速度和起源
  • 批准号:
    2237435
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Travel: NSF Student Travel Support for the 2023 IEEE International Conference on Data Mining (IEEE ICDM 2023)
旅行:2023 年 IEEE 国际数据挖掘会议 (IEEE ICDM 2023) 的 NSF 学生旅行支持
  • 批准号:
    2324784
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
SHINE: Understanding the Physical Connection of the in-situ Properties and Coronal Origins of the Solar Wind with a Novel Artificial Intelligence Investigation
SHINE:通过新颖的人工智能研究了解太阳风的原位特性和日冕起源的物理联系
  • 批准号:
    2229138
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
OAC Core: SMALL: DeepJIMU: Model-Parallelism Infrastructure for Large-scale Deep Learning by Gradient-Free Optimization
OAC 核心:小型:DeepJIMU:通过无梯度优化实现大规模深度学习的模型并行基础设施
  • 批准号:
    2007976
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Spatial Network Deep Generative Modeling, Transformation, and Interpretation
职业:空间网络深度生成建模、转换和解释
  • 批准号:
    2113350
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
CRII: III: Interpretable Models for Spatio-Temporal Event Forecasting using Social Sensors
CRII:III:使用社交传感器进行时空事件预测的可解释模型
  • 批准号:
    2103745
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Spatial Network Deep Generative Modeling, Transformation, and Interpretation
职业:空间网络深度生成建模、转换和解释
  • 批准号:
    1942594
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
OAC Core: SMALL: DeepJIMU: Model-Parallelism Infrastructure for Large-scale Deep Learning by Gradient-Free Optimization
OAC 核心:小型:DeepJIMU:通过无梯度优化实现大规模深度学习的模型并行基础设施
  • 批准号:
    2106446
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: Deep Generative Models for Temporal Graph Generation and Interpretation
III:小:用于时间图生成和解释的深度生成模型
  • 批准号:
    2007716
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: 3D Graph Neural Networks: Completeness, Efficiency, and Applications
III:小:3D 图神经网络:完整性、效率和应用
  • 批准号:
    2243850
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: SMALL: Graph Contrastive Learning for Few-Shot Node Classification
III:SMALL:少样本节点分类的图对比学习
  • 批准号:
    2229461
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316305
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Graph-Oriented Usable Interpretation
合作研究:III:小型:面向图形的可用解释
  • 批准号:
    2223768
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Graph-Oriented Usable Interpretation
合作研究:III:小型:面向图形的可用解释
  • 批准号:
    2223769
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: Comprehensive Methods to Learn to Augment Graph Data
III:小:学习增强图数据的综合方法
  • 批准号:
    2146761
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    2053286
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: Nonlinear Processes for Detailed and Principled Insight into Graph Data
III:小:非线性过程,用于详细、有原则地洞察图数据
  • 批准号:
    2007481
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了