基于多源信息融合的蛋白质结构域折叠模式预测模型研究
项目介绍
AI项目解读
基本信息
- 批准号:61602100
- 项目类别:青年科学基金项目
- 资助金额:20.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2019
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2019-12-31
- 项目参与者:孔亮; 李峰; 王海娜;
- 关键词:
项目摘要
It is one of the great challenges to describe the structure and biology function of protein in post-genome era. Prediction of domain folding pattern of proteins is essential and important to their structure and biology function analysis. According to different granularities, prediction of protein domain folding pattern contains two sub-problems: prediction of protein structural class and prediction of protein fold. Based on the modern theories and methods of statistical pattern recognition, feature representation from multi-source information and information fusion classifier system will be studied in a following simple-to-complex way in this project. Firstly, the key factors which reflect the characters of protein folding structure will be analyzed, and data description and feature representation of proteins from multi-source information will be designed. Secondly, to construct coarse-grained protein structural class prediction model, a multiple kernel learning system framework will be proposed to fuse the complementary information of patterns hidden in multi-feature. Finally, on the basis of hierarchical inclusion relationship between the concepts of protein structural class and protein fold, a fusion mechanism will be designed from the aspects of feature representation and classifier design to fuse structural class annotation. Moreover, the fusion mechanism will be embedded into a hierarchical protein fold prediction model to perform high-quality prediction of domain folding pattern in the fine-grained level. The results of this project will promote the research on protein structure and biology function. In addition, it is also of great benefit to extend the application of theories and methods of pattern recognition in bioinformatics community.
描述蛋白质结构及其生物学功能是后基因组时代的重大挑战之一。预测蛋白质结构域折叠模式是蛋白质结构和功能分析中的重要一环。根据折叠模式的不同粒度,蛋白质结构域折叠模式预测涵盖结构类预测和折叠子预测两个子问题。本申请项目基于现代统计模式识别理论与方法,从多源信息特征表示和信息融合分类器系统设计等方面展开由简到繁的递进式研究。首先,分析反映蛋白质折叠结构特点的关键因素,设计多源信息下蛋白质的数据描述和特征表示方法;其次,提出多核学习框架融合多源特征的互补模式信息,构建粗粒度层蛋白质结构类预测模型;最后,基于结构类和折叠子两概念间的层次性包含关系,从特征表示和分类器设计两个方面设计结构类注释信息融合机制,并将其嵌入到层次化折叠子预测模型中,最终实现细粒度层折叠模式的高效预测。本项目的研究成果将促进蛋白质结构和功能的研究,同时也有助于拓展模式识别理论与方法在生物信息学领域的应用研究。
结项摘要
描述蛋白质结构及其生物学功能是后基因组时代的重大挑战之一。预测蛋白质结构域折叠模式是蛋白质结构和功能分析中的重要一环。整个项目的研究围绕着蛋白质结构域折叠模式预测相关理论与关键技术,按照计划书任务,分层次分步骤进行。首先分析反映蛋白质折叠结构特点的关键因素,设计多源信息下蛋白质的数据描述和特征表示方法;在此基础上,设计多分类器系统融合多源特征的互补模式信息,构建粗粒度层蛋白质结构类预测模型;针对获取的蛋白质结构类注释信息,设计融合机制,将其嵌入到多分类器系统框架中,并最终构建出该框架下的细粒度层蛋白质折叠子预测模型。本项目的研究结果主要体现在:(1)提出了一种基于蛋白质二级结构图形表示的特征表示方法。使用推广的混沌游走表示方法图形化蛋白质二级结构序列,将二级结构元素间的一维线性距离扩展二维平面距离,在此基础上构造若干描述二级结构距离分布的统计量作为蛋白质特征。该类特征对于提高较难区分的α/β类和α+β类蛋白质有显著效果。(2)提出了一种基于蛋白质序列进化信息的特征表示方法。从蛋白质氨基酸序列出发,整合位置特异性打分矩阵蕴含的蛋白质序列进化保守性信息,提出3种序列进化相关函数,多方面描述蛋白质序列氨基酸之间整体和局部的排列顺序信息。(3)提出了基于“软分类”的层次化蛋白质折叠模式预测框架。该层次化预测框架可以有效降低粗粒度层蛋白质结构类的错误分类对最终折叠子的分类带来的负面影响。综合上述结果,本项目的研究不仅丰富蛋白质结构域折叠模式预测等生物信息学研究领域的理论和方法,对后续蛋白质结构、功能和生物技术的发展也具有重要的指导意义。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An ensemble method for multi-type Gram-negative bacterial secreted protein prediction by integrating different PSSM-based features
一种集成不同 PSSM 特征的多类型革兰氏阴性细菌分泌蛋白预测的集成方法
- DOI:10.1080/1062936x.2019.1573438
- 发表时间:2019-03-04
- 期刊:SAR AND QSAR IN ENVIRONMENTAL RESEARCH
- 影响因子:3
- 作者:Kong, L.;Zhang, L.
- 通讯作者:Zhang, L.
i6mA-DNCP: Computational Identification of DNA N6-Methyladenine Sites in the Rice Genome Using Optimized Dinucleotide-Based Features
i6mA-DNCP:使用优化的基于二核苷酸的特征计算鉴定水稻基因组中的 DNA N6-甲基腺嘌呤位点
- DOI:10.3390/genes10100828
- 发表时间:2019-10-01
- 期刊:GENES
- 影响因子:3.5
- 作者:Kong, Liang;Zhang, Lichao
- 通讯作者:Zhang, Lichao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
白光高压LED的加速老化实验研究
- DOI:--
- 发表时间:2013
- 期刊:长春理工大学学报(自然科学版)
- 影响因子:--
- 作者:张丽超;高欣;薄报学;李抒智
- 通讯作者:李抒智
超声辅助提取枸杞多糖的研究进展
- DOI:10.13386/j.issn1002-0306.2015.20.071
- 发表时间:2015
- 期刊:食品工业科技
- 影响因子:--
- 作者:李冬梅;杭方学;陆海勤;谢彩锋;李凯;张丽超
- 通讯作者:张丽超
过表达iNOS基因小鼠模型对日本血吸虫寄生适应性影响的研究
- DOI:--
- 发表时间:2022
- 期刊:热带医学杂志
- 影响因子:--
- 作者:赵思雨;胡云逸;张丽超;徐美依宁;江可风;吴忠道;沈佳
- 通讯作者:沈佳
S1通过调节糖代谢途径抑制黑色素瘤B16细胞生长作用的体内外研究
- DOI:--
- 发表时间:2017
- 期刊:中国实验诊断学
- 影响因子:--
- 作者:李亚平;吴瑶;张娟娟;张丽超;苏静
- 通讯作者:苏静
过表达VSIG4对小鼠体内日本血吸虫生殖系统发育的影响
- DOI:--
- 发表时间:2022
- 期刊:解剖学研究
- 影响因子:--
- 作者:胡云逸;彭美;向锁玉;赵思雨;张丽超;吴忠道;沈佳
- 通讯作者:沈佳
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}