分形与统计相关方法在蛋白质亚细胞定位及功能预测中的应用
结题报告
批准号:
11401503
项目类别:
青年科学基金项目
资助金额:
23.0 万元
负责人:
韩国胜
依托单位:
学科分类:
A0204.几何测度论与分形
结题年份:
2017
批准年份:
2014
项目状态:
已结题
项目参与者:
王熙逵、石龙、宋玉琴、刘金龙、李宝根
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
随着生物技术的不断进步与生物信息学研究的不断深入,生物学数据每年在以指数级增长。仅仅靠既昂贵又耗时的生化实验来分析这海量级数据及其相关的生物学问题,已不太现实。为适应这种需求,研发可靠高效的计算方法和算法已迫在眉睫。分形及相关方法是非线性科学中重要的方法。分形和统计方法在生物信息问题中已广为应用。本项目重点研究分形与统计相关方法在生物信息学中的蛋白质亚细胞定位及功能预测等热点问题中的应用。我们的研究内容包括:发展一套基于分形及统计相关方法的蛋白质亚细胞定位及功能预测的方法,希望有益于相关问题的进一步研究;发展出一些有效的蛋白质序列转化的数值序列表示与稀疏网络表示方法;发展原有的非线性科学方法和统计方法,提出新的特征提取方法;挖掘与蛋白质亚细胞定位及功能预测紧密相关的特征信息;发展有效的蛋白质亚细胞定位及功能预测的多标签学习算法;构建相关问题的生物信息学平台,供研究人员使用。
英文摘要
With the development of biotechnology and bioinformatics, biological data have increased in exponential way every year. It is not really practical to analyze such mass data alone by performing expensive and time-consuming biochemical experiments. To meet such requirement, it is extremely urgent to develop reliable and effective computational methods and algorithms. Fractal and related methods are important methods in nonlinear science. Fractal and statistical methods have been widely used in bioinformatics. This project focuses on the application of fractal and statistics related method to the problems of protein subcellular localization and protein function prediction in bioinformatics. The research contents of our project include: developing some methods for the prediction of protein subcellular locations and functions based on the fractal and statistics related methods, and hope to be helpful for further research of related problems; developing some efficient numerical representations and sparse network representations for protein sequences; developing some new feature extraction methods based on nonlinear science methods and statistical methods; getting the key feature information related to the prediction of protein subcellular locations and functions; developing efficient multi-label algorithms for the prediction of protein subcellular locations and functions; design web-servers of related problems for researchers in bioinformatics.
本课题组基于分形和统计方法,系统研究了蛋白质亚细胞定位和功能预测问题。(1) 首先针对蛋白质亚细胞位置的多重属性,我们提出了一种新的多标签学习算法(正则化的径向基函数网络模型),对于多个标准数据集我们模型的性能都是最优的。 (2) 基于氨基酸物理化学特性,我们获得了蛋白质一级结构的水平可视图表示,这个表示方法提取的网络特征充分考虑了氨基酸残基间的长程相关性,在两个标准数据集上的性能证实了我们方法的有效性。(3) 针对宏基因组数据,我们提出了一种有效的可视化模型--内核苷酸距离谱,在三个标准数据集上的最终结果显示内核苷酸距离谱可以作为基因组的签名特征。(4) 我们提出一个新的序列表示方法—高阶马尔可夫表示,这个模型充分考虑了序列中字符的顺序关系,整个模型不需要参数选择。在标准数据集上,我们的方法不仅优于传统方法的而且在计算上有明显的优势。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Some Applications ofNonlinear Science Methods and Support Vector Machine Methods to ProteinProblems
非线性科学方法和支持向量机方法在蛋白质问题中的一些应用
DOI:--
发表时间:2015
期刊:Mini-Reviews In Organic Chemistry (影响因子: 1.095 for 2016)
影响因子:--
作者:Guo-Sheng Han;Zu-Guo Yu;Zhi-Qin Zhao
通讯作者:Zhi-Qin Zhao
A novel genome signature based on inter-nucleotide distances profiles for visualization of metagenomic data
基于核苷酸间距离概况的新型基因组特征,用于宏基因组数据的可视化
DOI:10.1016/j.physa.2017.04.064
发表时间:2017-09-15
期刊:PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS
影响因子:3.3
作者:Xie,Xian-Hua;Yu,Zu-Guo;Anh,Vo
通讯作者:Anh,Vo
基于多源数据融合和张量分解的ncRNA 与疾病关联关系预测研究
  • 批准号:
    2021JJ30684
  • 项目类别:
    省市级项目
  • 资助金额:
    0.0万元
  • 批准年份:
    2021
  • 负责人:
    韩国胜
  • 依托单位:
国内基金
海外基金