基于氨基酸序列协同进化编码的蛋白质热点残基预测
结题报告
批准号:
61300058
项目类别:
青年科学基金项目
资助金额:
27.0 万元
负责人:
陈鹏
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2016
批准年份:
2013
项目状态:
已结题
项目参与者:
袁莉、吴杭、张聪明、吴攀攀、毛永荣、陈萌、许玉荣
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
蛋白质经常与其他蛋白质发生相互作用(PPI)以执行相关的功能,是蛋白质组学中亟待解决的关键问题。本项目提出PPI位点/Hotspots的形成与氨基酸的进化环境密切相关的假设,从蛋白质的一级序列出发,研究PPI位点/Hotspots在疏水力等物理化学环境上的进化关系,以探索PPI的规律与本质。首先,研究基于疏水作用力等理化特征的氨基酸残基的进化谱,并由此对蛋白质的氨基酸残基进行相关协同进化编码;然后,构建相互作用位点的motif进化库,在此motif进化库中BLAST搜索发现目标蛋白质可能的作用位点以及Hotspots;同时开发多核空间多输入均衡数据集的集成学习方法来预测PPI位点及Hotspots;最后融合两种预测结果,以达到更好的预测效果。本项目的成果可以为了解蛋白质生理功能的实现机制和治疗相关疾病的药物靶点设计提供理论上的依据。
英文摘要
Protein always interacts with other proteins (Protein-Protein Interaction, PPI) to help perform functions, which is almost a vital issue to be solved urgently in proteomics. The solution of the issue can be used to understand the essence of life acitivities and further push the development of whole bioinformatics. The proposal presents a hypotheses that there might have high relationship between evolutionary context of amino acid residues and the formation of PPI sites/Hotspots. The proposal is based on amino acid sequence only, investigates the evolutionary context of PPI sites with respect to hydrophobicity and other physicochemical properties of residues, and further discovers the essence of PPI. First, study the co-evolutionary profile of amino acid residues based on hydrophobicity and other physicochemical characters, and further encode amino acids in protein chain by the use of correlation methods. Second, construct the motif library for PPI sites/Hot spots and search for homology PPI sites/Hotspots of target protein in the motif library by running BLAST program. Further, develop ensemble method of multi-kernels with balanced multi-input datasets for predicting PPI sites/Hotspots. Finally, obtain better predictions by combining the two prediction results. As a result, the proposal can used to understanding protein functions and hence providing rationales for drug target design for curing related diseases.
蛋白质经常与其他蛋白质发生相互作用(PPI)以执行相关的功能,是蛋白质组学中亟待解决的关键问题。本项目提出PPI位点/Hotspots的形成与氨基酸的进化环境密切相关的假设,从蛋白质的一级序列出发,研究PPI位点/Hotspots在疏水力等物理化学环境上的进化关系,以探索PPI的规律与本质。本项目围绕蛋白质相互作用中的相关研究问题,构建了一个蛋白质残基的新型编码,加快了分类器的识别速度,提高了识别精度;针对蛋白相互作用,提出了几种有效的集成分类器算法,提高了相互作用及其作用位点残基的识别精度和效率;另外,在机器学习算法方面,我们提出了稀疏表达和多核学习融合的机器学习算法,提高了目标跟踪效率,并应用到农业病虫害的识别上,同时开发了手机APP,达到实时上传从而识别病虫害的应用目的,具有较高的应用前景。本项目的成果可以为了解蛋白质生理功能的实现机制和治疗相关疾病的药物靶点设计提供理论上的依据。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2016
期刊:Journal of Chromatography A
影响因子:4.1
作者:Huang, De-shuang;Jiang, Changjun;Zhang, Jun;Chen, Peng
通讯作者:Chen, Peng
A dynamic ensemble learning system to identify ligand-binding residues from sequence information only
动态集成学习系统,仅从序列信息中识别配体结合残基
DOI:--
发表时间:2016
期刊:ACM/IEEE Transactions on Computational Biology and Bioinformatics
影响因子:--
作者:Peng Chen
通讯作者:Peng Chen
DOI:10.1016/j.neucom.2016.10.039
发表时间:2017-03
期刊:Neurocomputing
影响因子:6
作者:Jun Zhang;Muchun Zhu;Peng Chen;B. Wang
通讯作者:Jun Zhang;Muchun Zhu;Peng Chen;B. Wang
LigandRFs: random forest ensemble to identify ligand-binding residues from sequence information alone.
LigandRFs:随机森林集合,仅从序列信息中识别配体结合残基。
DOI:10.1186/1471-2105-15-s15-s4
发表时间:2014
期刊:BMC bioinformatics
影响因子:3
作者:Chen P;Huang JZ;Gao X
通讯作者:Gao X
DOI:10.1016/j.jvcir.2013.12.012
发表时间:2014-02
期刊:J. Vis. Commun. Image Represent.
影响因子:--
作者:Chengjun Xie;Jieqing Tan;Peng Chen;Jie Zhang;Lei He
通讯作者:Chengjun Xie;Jieqing Tan;Peng Chen;Jie Zhang;Lei He
蛋白质-配体相互作用的深度学习自动编码和随机映射研究
  • 批准号:
    61672035
  • 项目类别:
    面上项目
  • 资助金额:
    64.0万元
  • 批准年份:
    2016
  • 负责人:
    陈鹏
  • 依托单位:
设计功能化表面调控高分子体系组装
  • 批准号:
    20974001
  • 项目类别:
    面上项目
  • 资助金额:
    34.0万元
  • 批准年份:
    2009
  • 负责人:
    陈鹏
  • 依托单位:
功能化表面的设计及其对高分子的诱导组装
  • 批准号:
    20804001
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    8.0万元
  • 批准年份:
    2008
  • 负责人:
    陈鹏
  • 依托单位:
国内基金
海外基金