基于信息融合的基因集富集度Meta分析方法研究

批准号:
61202273
项目类别:
青年科学基金项目
资助金额:
24.0 万元
负责人:
张少宏
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2015
批准年份:
2012
项目状态:
已结题
项目参与者:
Hau-SanWong、张为、唐琳、张汛涞、吴际、邓霞、罗桂联、宋一赞、欧家权
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
使用基因集富集度分析生物过程中的基因调控机制,是目前公认的标准生物信息学方法,而综合不同独立实验数据的Meta分析方法常被用来提高结果的可靠性。由于目前在干细胞源性心肌细胞和癌症干细胞等相关研究中,各独立研究数据集样本有限、共有基因稀少、平台多样化和数据重要程度不同等特点,传统方法难以奏效。针对上述问题,本课题提出基于信息融合的基因集富集度Meta分析方法,创新之处主要包括:(1)特征映射机制为基因集富集度Meta分析综合处理各独立研究数据提供统一平台基础,同时可将处理范围从传统方法的两类问题推广至多类问题及无监督问题;(2)基于非均匀聚类融合的样本相似性衡量方法,能有效分辨样本真实相似度与随机产生的伪相似度,为样本抽样提供计算依据。本课题提出的研究,为深入了解相关基因调控机制提供重要计算方法和实用信息技术。
英文摘要
Gene set enrichment analysis is one of the most standard bioinformatics approaches to characterize the gene regulatory mechanisms with gene expression data. Moreover, integration of independent studies on the same topics, which is referred to as Meta analysis, is well recognized to improve reliability. However, for gene expression data of cancer stem cells and stem cell derived- cardiomyocytes, it is unpractical to combine various data from different studies to perform effective gene set enrichment analysis, due to the limited numbers of data samples, the rare common genes from various studies, the diversity of various platforms of different studies, and the different importance of data sets. In view of these problems, in this project, we propose to perform gene set enrichment Meta analysis methods based on information ensemble methods with the following novelties: (1) Feature mapping provides effective solution for gene set enrichment Meta analysis on different data and enables the proposed methods to handle multiple-class problems and unsupervised problems while traditional methods can only handle 2-class problems; (2) Data sample similarity measures based on heterogeneous cluster ensembles discriminate the real similarity from the false positive one generated by chances. Our study will provide both improved insight into the gene regulatory mechanisms for the related studies and practical computational approaches for future investigation.
本研究项目的结果包括两方面内容:(1)借鉴信息融合技术,基于基因标志列表的多个基因表达数据集的稀缺数据集的基因集Meta分析方法,并应用于干细胞源性心肌细胞;(2)探索部分数据融合的挖掘方法(主要包括约束聚类和聚类融合)和蛋白质作用网络问题,为后续的多源异构基因数据挖掘课题做好准备。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
An effective and efficient peptide binding prediction approach for a broad set of HLA-DR molecules based on ordered weighted averaging of binding pocket profiles
基于结合口袋分布的有序加权平均的针对广泛的 HLA-DR 分子的有效且高效的肽结合预测方法
DOI:--
发表时间:2013
期刊:Proteome Science
影响因子:2
作者:Wen-Jun Shen;Shaohong Zhang;Hau-San Wong
通讯作者:Hau-San Wong
Gene set enrichment ensemble using fold change data only
仅使用倍数变化数据的基因集富集集成
DOI:10.1016/j.jbi.2015.07.019
发表时间:2015-10
期刊:Journal of Biomedical Informatics
影响因子:4.5
作者:Shaohong Zhang;Shaohong Zhang;Shaohong Zhang;Shaohong Zhang
通讯作者:Shaohong Zhang
An efficient algorithm for pairwise local alignment of protein interaction networks
蛋白质相互作用网络成对局部比对的有效算法
DOI:10.1142/s0219720015500031
发表时间:2015-04
期刊:Journal of Bioinformatics and Computational Biology
影响因子:1
作者:Matthew Schmidt;Wenhong Tian;Wenhong Tian;Shaohong Zhang
通讯作者:Shaohong Zhang
Consensus comparative analysis of human embryonic stem cell-derived cardiomyocytes.
人胚胎干细胞来源的心肌细胞的共识比较分析
DOI:10.1371/journal.pone.0125442
发表时间:2015
期刊:PloS one
影响因子:3.7
作者:Zhang S;Poon E;Xie D;Boheler KR;Li RA;Wong HS
通讯作者:Wong HS
基于信息融合的多源异构数据相似度无监督衡量方法研究
- 批准号:n/a
- 项目类别:省市级项目
- 资助金额:10.0万元
- 批准年份:2022
- 负责人:张少宏
- 依托单位:
国内基金
海外基金
