III: Small: Graph Generative Deep Learning for Protein Structure Prediction

III:小:用于蛋白质结构预测的图生成深度学习

基本信息

  • 批准号:
    1907805
  • 负责人:
  • 金额:
    $ 49.98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-08-01 至 2021-02-28
  • 项目状态:
    已结题

项目摘要

Decades of scientific enquiry beyond molecular biology have demonstrated just how fundamental form is to function, whether in understanding phase transitions in statistical physics, predicting the evolution and dynamics of real networks in network science, or successfully steering an articulated robot arm to a target pose. A fundamental question in all these scientific domains is how to effectively explore the space of all possible forms of a dynamic system to uncover those that satisfy non-trivial constraints imposed by function. The most visible instantiation of this question in computational structural biology is de-novo protein structure prediction (PSP). PSP takes a structure-driven view of understanding molecular mechanisms in the cell and seeks to determine one or more biologically-active/native structures of a protein from knowledge of its chemical composition. Elucidating such structures is central to inferring the biological activities of a rapidly-growing number of protein-encoding gene sequences and thus advancing our understanding of the inner workings of a cell. While PSP has a natural formulation under stochastic optimization, current efforts are approaching a saturation point. This project proposes a radically-different, complementary approach. Inspired by recent momentum in generative deep learning, the project approaches de-novo PSP under the umbrella of generative, adversarial deep learning. The approach is firmly grounded in information integration and informatics, as it proposes generative models that learn in an adversarial setting to generate native-like tertiary protein structures. The project benefits researchers in machine learning, deep learning, and information integration with interests in graph generative models, molecule generation, and protein structure prediction. The project will result in open-source codes, online teaching modules and tutorials, publicly-available data and models, workshops, software demos, and will broaden the participation in computing of under-represented students.The activities in this project chart a new algorithmic path under the umbrella of information integration and informatics to address the current impasse in structure-function related problems in molecular biology. The focus is on the de-novo protein structure prediction problem. With experimental structure determination lagging behind the rapidly-growing number of protein-encoding gene sequences by high-throughput sequencing technologies, computational approaches have a central role in molecular biology research. Great progress has been made through stochastic optimization, but current approaches are experiencing diminishing returns, partly due to fundamental challenges concerning the resource-aware exploration-exploitation control in complex search spaces and inherently inaccurate scoring functions. This project puts forth a novel approach to structure prediction under the umbrella of generative, adversarial deep learning, leveraging recent advances and opportunities in graph generative learning, adversarial learning, and deep learning. Generative models learn in an adversarial setting to generate native-like tertiary protein structures. The proposed activities span multiple disciplines and promise to make general contributions in machine learning, deep learning, explainable AI, molecular modeling, and computational biology. The work will also benefit researchers and students interested in modeling complex, dynamic systems. The investigators will disseminate the proposed research via open-source codes in C++ and Python so as to reach diverse communities of researchers and students, online teaching modules and tutorials, trained models and data. They will actively educate involved communities through workshops, tutorials, and software demonstrations. This interdisciplinary project also creates excellent opportunities to broaden the participation in computing of under-represented students of all backgrounds.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
几十年来,在分子生物学之外的科学探索已经证明了基本形式是如何发挥作用的,无论是在理解统计物理学中的相变,预测网络科学中真实网络的进化和动态,还是成功地将铰接机器人手臂转向目标姿势。所有这些科学领域的一个基本问题是如何有效地探索一个动态系统的所有可能形式的空间,以发现那些满足函数施加的非平凡约束的形式。在计算结构生物学中,这个问题最明显的实例是de-novo蛋白质结构预测(PSP)。PSP采用结构驱动的观点来理解细胞中的分子机制,并试图从其化学组成的知识中确定蛋白质的一个或多个生物活性/天然结构。阐明这些结构对于推断数量迅速增长的蛋白质编码基因序列的生物活动至关重要,从而促进我们对细胞内部工作原理的理解。虽然PSP在随机优化下具有自然的公式,但目前的努力正在接近饱和点。该项目提出了一种完全不同的互补方法。受最近生成式深度学习发展势头的启发,该项目在生成式、对抗性深度学习的框架下进行了从头开始的PSP。该方法牢固地建立在信息集成和信息学的基础上,因为它提出了在对抗环境中学习以生成原生三级蛋白质结构的生成模型。该项目有利于机器学习、深度学习和信息集成方面的研究人员,并对图生成模型、分子生成和蛋白质结构预测感兴趣。该项目将产生开源代码、在线教学模块和教程、公开可用的数据和模型、研讨会、软件演示,并将扩大代表性不足的学生对计算机的参与。本项目的活动在信息集成和信息学的保护下绘制了一条新的算法路径,以解决当前分子生物学中结构-功能相关问题的僵局。重点研究了de-novo蛋白结构预测问题。由于实验结构的确定落后于高通量测序技术快速增长的蛋白质编码基因序列,计算方法在分子生物学研究中发挥了核心作用。随机优化已经取得了很大的进展,但目前的方法正在经历收益递减的过程,部分原因在于复杂搜索空间中资源感知勘探开发控制的基本挑战以及固有的不准确的评分函数。该项目提出了一种在生成式、对抗性深度学习的保护下进行结构预测的新方法,利用了图生成式学习、对抗性学习和深度学习方面的最新进展和机会。生成模型在对抗环境中学习生成原生的三级蛋白质结构。提议的活动跨越多个学科,并承诺在机器学习,深度学习,可解释的人工智能,分子建模和计算生物学方面做出普遍贡献。这项工作也将使对复杂动态系统建模感兴趣的研究人员和学生受益。研究人员将通过c++和Python的开源代码传播拟议的研究,以便接触到不同的研究人员和学生社区、在线教学模块和教程、训练过的模型和数据。他们将通过研讨会、教程和软件演示积极地教育相关社区。这个跨学科的项目也创造了极好的机会,扩大了所有背景的代表性不足的学生对计算机的参与。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Dynamic Activation of Clients and Parameters for Federated Learning over Heterogeneous Graphs
Zero-Shot Cross-Lingual Machine Reading Comprehension via Inter-Sentence Dependency Graph
  • DOI:
    10.1609/aaai.v36i10.21407
  • 发表时间:
    2021-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Liyan Xu;Xuchao Zhang;Bo Zong;Yanchi Liu;Wei Cheng;Jingchao Ni;Haifeng Chen;Liang Zhao;Jinho D. Choi
  • 通讯作者:
    Liyan Xu;Xuchao Zhang;Bo Zong;Yanchi Liu;Wei Cheng;Jingchao Ni;Haifeng Chen;Liang Zhao;Jinho D. Choi
Schematic Memory Persistence and Transience for Efficient and Robust Continual Learning
Designing a Direct Feedback Loop between Humans and Convolutional Neural Networks through Local Explanations
  • DOI:
    10.1145/3610187
  • 发表时间:
    2023-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tong Sun;Yuyang Gao;Shubham Khaladkar;Sijia Liu;Liang Zhao;Younghoon Kim;S. Hong
  • 通讯作者:
    Tong Sun;Yuyang Gao;Shubham Khaladkar;Sijia Liu;Liang Zhao;Younghoon Kim;S. Hong
Metagraph Aggregated Heterogeneous Graph Neural Network for Illicit Traded Product Identification in Underground Market
  • DOI:
    10.1109/icdm50108.2020.00022
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yujie Fan;Yanfang Ye;Qian Peng;Jianfei Zhang;Yiming Zhang-;Xusheng Xiao;C. Shi;Qi Xiong;Fudong Sh
  • 通讯作者:
    Yujie Fan;Yanfang Ye;Qian Peng;Jianfei Zhang;Yiming Zhang-;Xusheng Xiao;C. Shi;Qi Xiong;Fudong Sh
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Liang Zhao其他文献

Novel imidazolium stationary phase for high-performance liquid chromatography.
用于高效液相色谱的新型咪唑固定相。
  • DOI:
    10.1016/j.chroma.2006.03.016
  • 发表时间:
    2006-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hongdeng Qiu;Shengxiang Jiang;Xia Liu*;Liang Zhao
  • 通讯作者:
    Liang Zhao
The QUENDA-BOT: Autonomous Robot for Screw-Fixing Installation in Timber Building Construction
QUENDA-BOT:木结构建筑中用于螺钉固定安装的自主机器人
Phenotypic effects of the nurse Thylacospermum caespitosum on dependent plant species along regional climate stress gradients
沿区域气候胁迫梯度,袋囊草保育员对依赖植物物种的表型影响
  • DOI:
    10.1111/oik.04512
  • 发表时间:
    2018-02
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Xingpei Jiang;Richard Michalet;Shuyan Chen;Liang Zhao;Xiangtai Wang;Chenyue Wang;Lizhe An;Sa Xiao
  • 通讯作者:
    Sa Xiao
Interannual variability of dimethylsulfide in the Yellow Sea
黄海二甲硫醚的年际变化
  • DOI:
    10.1007/s00343-020-0480-0
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Sijia Wang;Qun Sun;Shuai Li;Jiawei Shen;Qian Liu;Liang Zhao
  • 通讯作者:
    Liang Zhao
Tape-Assisted Photolithographic-Free Microfluidic Chip Cell Patterning for Tumor Metastasis Study
用于肿瘤转移研究的胶带辅助免光刻微流控芯片细胞图案化
  • DOI:
    10.1021/acs.analchem.7b03225
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    7.4
  • 作者:
    Liang Zhao;Tengfei Guo;Lirong Wang;Yang Liu;Ganyu Chen;Hao Zhou;Meiqin Zhang
  • 通讯作者:
    Meiqin Zhang

Liang Zhao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Liang Zhao', 18)}}的其他基金

Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403312
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Uncovering Solar Wind Composition, Acceleration, and Origin through Observations, Modeling, and Machine Learning Methods
职业:通过观测、建模和机器学习方法揭示太阳风的成分、加速度和起源
  • 批准号:
    2237435
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Travel: NSF Student Travel Support for the 2023 IEEE International Conference on Data Mining (IEEE ICDM 2023)
旅行:2023 年 IEEE 国际数据挖掘会议 (IEEE ICDM 2023) 的 NSF 学生旅行支持
  • 批准号:
    2324784
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
SHINE: Understanding the Physical Connection of the in-situ Properties and Coronal Origins of the Solar Wind with a Novel Artificial Intelligence Investigation
SHINE:通过新颖的人工智能研究了解太阳风的原位特性和日冕起源的物理联系
  • 批准号:
    2229138
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
III: Small: Graph Generative Deep Learning for Protein Structure Prediction
III:小:用于蛋白质结构预测的图生成深度学习
  • 批准号:
    2110926
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
OAC Core: SMALL: DeepJIMU: Model-Parallelism Infrastructure for Large-scale Deep Learning by Gradient-Free Optimization
OAC 核心:小型:DeepJIMU:通过无梯度优化实现大规模深度学习的模型并行基础设施
  • 批准号:
    2007976
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Spatial Network Deep Generative Modeling, Transformation, and Interpretation
职业:空间网络深度生成建模、转换和解释
  • 批准号:
    2113350
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
CRII: III: Interpretable Models for Spatio-Temporal Event Forecasting using Social Sensors
CRII:III:使用社交传感器进行时空事件预测的可解释模型
  • 批准号:
    2103745
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
CAREER: Spatial Network Deep Generative Modeling, Transformation, and Interpretation
职业:空间网络深度生成建模、转换和解释
  • 批准号:
    1942594
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
OAC Core: SMALL: DeepJIMU: Model-Parallelism Infrastructure for Large-scale Deep Learning by Gradient-Free Optimization
OAC 核心:小型:DeepJIMU:通过无梯度优化实现大规模深度学习的模型并行基础设施
  • 批准号:
    2106446
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: 3D Graph Neural Networks: Completeness, Efficiency, and Applications
III:小:3D 图神经网络:完整性、效率和应用
  • 批准号:
    2243850
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: SMALL: Graph Contrastive Learning for Few-Shot Node Classification
III:SMALL:少样本节点分类的图对比学习
  • 批准号:
    2229461
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316305
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Graph-Oriented Usable Interpretation
合作研究:III:小型:面向图形的可用解释
  • 批准号:
    2223768
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Graph-Oriented Usable Interpretation
合作研究:III:小型:面向图形的可用解释
  • 批准号:
    2223769
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: Comprehensive Methods to Learn to Augment Graph Data
III:小:学习增强图数据的综合方法
  • 批准号:
    2146761
  • 财政年份:
    2022
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    2053286
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
III: Small: Graph Generative Deep Learning for Protein Structure Prediction
III:小:用于蛋白质结构预测的图生成深度学习
  • 批准号:
    2110926
  • 财政年份:
    2020
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了