海量多源互补蛋白质数据的配体绑定位点预测研究

批准号:
61902352
项目类别:
青年科学基金项目
资助金额:
27.0 万元
负责人:
胡俊
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2022
批准年份:
2019
项目状态:
已结题
项目参与者:
--
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。随着蛋白质数据持续累积,海量、多源、互补已成为当前蛋白质数据的固有特性,研究高效可靠的计算方法来预测蛋白质配体绑定位点成为迫切需要。本项目针对蛋白质数据固有特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开相关研究,以进一步提升配体绑定位点预测性能。具体内容包括:1)多源、互补蛋白质数据的特征抽取与选择;2)基于数据清理与增量式学习的查询驱动方法;3)融合多标签学习的配体特异性预测方法;4)能够充分利用蛋白质先验信息及未标注功能蛋白质数据信息的深度学习方法;5)研发高通量配体绑定位点预测平台。本研究旨在为生物学及相关研究人员提供理论依据充分、精度高、可解释性强的应用系统,进一步丰富配体绑定位点预测领域的理论和方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。
英文摘要
Accurately identifying the ligand-binding sites in protein is of significant importance for understanding protein function, analyzing the relationship between biological molecules, and instructing drug design etc. With the continuous accumulation of protein data, massive, multi-source and complementary have become the inherent characteristics of current protein data. It is highly desired to develop intelligent computational methods for predicting the ligand-binding site from protein. In this project, we will systematically carry out research on protein-ligand binding site prediction models and methods based on the thorough evaluation on the characteristics of protein data and bottlenecks of the existing prediction methods. Our major research topics include: 1) we will extract the high-quality feature from the multi-source and complementary protein data; 2) to effectively deal with the massive and ever-increasing characteristic of protein data, we will propose new query-driven prediction model by fusing data cleaning and incremental learning; 3) we will enhance the performance of ligand-specific prediction by employing multi-label learning method; 4) we will enhance the efficacy of deep learning model in the ligand-binding site prediction by introducing the known biological knowledge of proteins and the extra knowledge extracting from the unlabeled protein data; and 5) based on the theoretical research results, we will design online prediction platform for high-throughput identifying protein-ligand binding sites. We expect to research and develop effective machine learning theory and algorithms for meeting the urgent demands of protein data analysis and processing from proteomics. Also, we will provide theoretically-sound, practically-good and highly interpretable protein computational models for biologists and general users. Our research will enrich the contents of protein computation, speed up the process of unveiling the relationship between protein sequence, structure and function, and further accelerate the development of bioinformatics.
精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。本项目针对蛋白质数据持续累积,海量、多源、互补的特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开了蛋白质与配体绑定位点预测方法研究。在蛋白质特征提取研究方面提出了:1) 基于加权卷积特征的蛋白质与DNA相互作用预测方法,2)基于立方体格式特征的蛋白质与DNA相互作用位点预测方法以及3)基于深度多视角特征学习框架的蛋白质溶剂可及性预测方法;在配体特异性的模板匹配研究方面提出了:1)基于查询特异性与支持向量机的蛋白质与配体绑定位点预测方法和2)基于模板查询的ATP特异性蛋白质与配体对接方法;在深度学习算法应用方面提出了基于深度卷积神经网络的蛋白质与ATP绑定位点预测方法。本项目的研究成果可以为生物学及相关研究人员提供精度高、可解释性强的配体绑定位点预测方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1016/j.ab.2021.114358
发表时间:2021-08
期刊:Analytical biochemistry
影响因子:2.9
作者:Xue-Qiang Fan;Junda Hu;Ning-Xin Jia;Dong-Jun Yu;Gui-jun Zhang
通讯作者:Xue-Qiang Fan;Junda Hu;Ning-Xin Jia;Dong-Jun Yu;Gui-jun Zhang
TargetDBP+: Enhancing the Performance of Identifying DNA-Binding Proteins via Weighted Convolutional Features
TargetDBP:通过加权卷积特征增强识别 DNA 结合蛋白的性能
DOI:--
发表时间:2021
期刊:Journal of Chemical Information and Modeling
影响因子:5.6
作者:Jun Hu;Liang Rao;Yi-Heng Zhu;Gui-Jun Zhang;Dong-Jun Yu
通讯作者:Dong-Jun Yu
Predicting RNA solvent accessibility from multi-scale context feature via multi-shot neural network
通过多镜头神经网络从多尺度上下文特征预测 RNA 溶剂可及性
DOI:10.1016/j.ab.2022.114802
发表时间:2022-07-20
期刊:ANALYTICAL BIOCHEMISTRY
影响因子:2.9
作者:Fan, Xue-Qiang;Hu, Jun;Zhang, Gui-Jun
通讯作者:Zhang, Gui-Jun
scTPA: A web tool for single-cell transcriptome analysis of pathway activation signatures
scTPA:用于通路激活特征的单细胞转录组分析的网络工具
DOI:10.1101/2020.01.15.907592
发表时间:2020-01
期刊:Bioinformatics
影响因子:5.8
作者:Yan Zhang;Yaru Zhang;Jun Hu;Ji Zhang;Fangjie Guo;Meng Zhou;Guijun Zhang;Fulong Yu;Jianzhong Su
通讯作者:Jianzhong Su
Protein-DNA Binding Residue Prediction via Bagging Strategy and Sequence-based Cube-Format Feature
通过装袋策略和基于序列的立方体格式特征预测蛋白质-DNA 结合残基
DOI:10.1109/tcbb.2021.3123828
发表时间:--
期刊:IEEE/ACM Transactions on Computational Biology and Bioinformatics
影响因子:--
作者:Hu Jun;Bai Yansong;Zheng Linlin;Jia Ningxin;Yu Dongjun;Zhang Guijun
通讯作者:Zhang Guijun
多域蛋白质残基接触图深度学习预测方法研究
- 批准号:LY21F020025
- 项目类别:省市级项目
- 资助金额:0.0万元
- 批准年份:2020
- 负责人:胡俊
- 依托单位:
供水管网输配过程中微生物胞外聚合物转化生成消毒副产物机制研究
- 批准号:51808496
- 项目类别:青年科学基金项目
- 资助金额:29.0万元
- 批准年份:2018
- 负责人:胡俊
- 依托单位:
国内基金
海外基金
