基于多尺度特征和整合机器学习方法的载脂蛋白识别及调控机制研究

批准号:
61702430
项目类别:
青年科学基金项目
资助金额:
29.0 万元
负责人:
唐华
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2020
批准年份:
2017
项目状态:
已结题
项目参与者:
罗亚梅、曹高飞、张春梅、陈蓉、陈丽媛、王琳、谭晓勇
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
载脂蛋白调节脂蛋白代谢及免疫炎症反应,参与人类多种疾病如动脉粥样硬化、糖尿病、心肌梗死和肿瘤等的发生发展。但面对海量数据和新型载脂蛋白的不断涌现,传统的生化实验研究已显得力不从心。借助计算的方法系统研究载脂蛋白势在必行。我们前期研究发现,载脂蛋白与非载脂蛋白序列之间存在特征性差异,转录因子NF-κB的活性改变可调节载脂蛋白M的表达。本项目拟在此基础上,建立一套载脂蛋白的理论识别和调控模型。通过搜集和构建全面的载脂蛋白数据库,采用多尺度的特征描述方法寻找载脂蛋白家族特有的序列、关联特征和规律性信息,进而利用特征筛选和整合机器学习方法,构建合理、高准确率的载脂蛋白预测模型;对预测得到的可能载脂蛋白,采用脂质-蛋白质共沉降技术进行实验验证;并利用动力学方法研究NF-κB对新型载脂蛋白M的调控机制。此项系统性的研究对深入理解和阐明载脂蛋白的生理学功能、合理选择药物靶点有着重要的指导意义和现实价值。
英文摘要
Apolipoprotein is in charge of maintaining the basic life process by regulating the metabolism of lipoprotein and immuno-inflammatory responses. The change in expression and function of apolipoprotein plays an important role in various diseases such as atherosclerosis, diabetes, myocardial infarction and tumor. In the presence of mass data and springing up of new apolipoproteins, it is difficult to study apolipoproteins by use of tranditional biochemistry method. It is imperative to systematically research apolipoproteins by computational approaches. Our previous studies showed that the apolipoproteins are different from non-apolipoproteins on sequence composition. The transcription factor, NF-κB can influence the expression of apolipoprotein M. Thus, the project is to construct a set of theoretical models for the identification of apolipoproteins. By searching and building high-quality apolipoprotein database, the multi-scale feature will be used to figure out the specific sequence and correlation information of the apolipoproteins. Based on feature selection algorithms and deep learning technique, we will construct a reliable and accurate predictive model for apolipoprotein prediction.The lipid-protein cosedimentation technique will be performed to verify the candidate apolipoproteins predicted by the model. Moreover, we will use kinetic methods to investigate the regulatory mechanism of apolipoprotein M by NF-κB. These systematic researches in the project are of great significance for understanding and clarifying the physiological function of apolipoprotein and rationally selecting drug targets.
载脂蛋白通过调节脂蛋白代谢及免疫炎症反应等途径,参与维持基本生命过程,其表达或功能改变对人类多种疾病如动脉粥样硬化、糖尿病、心肌梗死、肿瘤等的发生发展至关重要。本项目以载脂蛋白为研究对象,搜集、整理载脂蛋白数据,挖掘载脂蛋白的序列、结构、关联信息,发展出有效的载脂蛋白序列特征提取算法,建立高灵敏性、高精度、高特异性的载脂蛋白及其功能识别模型和识别工具。经过三年的努力,项目组取得的主要成果有:(1)构建了载脂蛋白序列,及其亚家族蛋白序列数据库。通过一系列的数据清理、冗余序列剔除等操作,获得了当前包含载脂蛋白和其亚家族信息最全的数据集,为构建可靠的预测模型提供有用信息;(2)采用四种蛋白质序列描述符对载脂蛋白和其亚家族蛋白的序列进行表征,并利用方差分析进行特征筛选,从而降低了特征向量的噪声,提高了模型的容错能力;(3)利用多种机器学习模型来对载脂蛋白和其亚家族进行识别,构建了高精度的预测模型;(4)构建了在线预测服务ApoPred,为快速识别载脂蛋白和其亚家族提供服务。.由于科学前沿问题的不断涌现,我们在相关领域还进行了研究,取得的成果包括:(1)在蛋白质功能类型识别方面,开发了多种特征融合方法,并用于噬菌体酶类型的识别、荷尔蒙蛋白的预测、以及细胞周期蛋白的辨认;(2)在核苷酸序列分析上,整合了多种特征提取算法,改进了细菌终止子的预测性能、提高了2OM修饰位点的识别精度;(3)在医疗健康领域,利用泸州市地区人群体检数据,开发了基于决策树的糖尿病人群预测模型。.基于这些工作,我们在Frontiers in Cell and Developmental Biology (IF: 5.186),Bioinformatics (IF: 5.610)和International Journal of Biological Sciences (IF: 4.858)等国际期刊发表SCI收录论文11篇,参加国际会议2 次,国内会议4次,培养在读硕士研究生3人。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.3389/fbioe.2020.00183
发表时间:2020-03-24
期刊:FRONTIERS IN BIOENGINEERING AND BIOTECHNOLOGY
影响因子:5.7
作者:Li, Hong-Fei;Wang, Xian-Fang;Tang, Hua
通讯作者:Tang, Hua
DOI:10.2174/1381612826666200310122324
发表时间:2020
期刊:Current Pharmaceutical Design
影响因子:--
作者:Ting Liu;Hua Tang
通讯作者:Hua Tang
iTerm-PseKNC: a sequence-based tool for predicting bacterial transcriptional terminators
iTerm-PseKNC:基于序列的预测细菌转录终止子的工具
DOI:10.1093/bioinformatics/bty827
发表时间:2019-05-01
期刊:BIOINFORMATICS
影响因子:5.8
作者:Feng, Chao-Qin;Zhang, Zhao-Yue;Lin, Hao
通讯作者:Lin, Hao
The Development of Machine Learning Methods in Cell-penetrating Peptides Identification: A Brief Review
机器学习方法在细胞穿透肽鉴定中的发展:简要回顾
DOI:10.2174/1389200219666181010114750
发表时间:2019
期刊:Current Drug Metabolism
影响因子:2.3
作者:Wei Huan Huan;Yang Wuritu;Tang Hua;Lin Hao
通讯作者:Lin Hao
ApoPred: Identification of Apolipoproteins and Their Subfamilies With Multifarious Features.
ApoPred:具有多种特征的载脂蛋白及其亚家族的鉴定
DOI:10.3389/fcell.2020.621144
发表时间:2020
期刊:Frontiers in cell and developmental biology
影响因子:5.5
作者:Liu T;Chen JM;Zhang D;Zhang Q;Peng B;Xu L;Tang H
通讯作者:Tang H
基于多任务策略的ncRNA-疾病关系预测深度学习模型的构建与研究
- 批准号:--
- 项目类别:面上项目
- 资助金额:60万元
- 批准年份:2021
- 负责人:唐华
- 依托单位:
国内基金
海外基金
