CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
基本信息
- 批准号:7960264
- 负责人:
- 金额:$ 3.83万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-05-01 至 2010-04-30
- 项目状态:已结题
- 来源:
- 关键词:AccountingAlgorithmsBioinformaticsBiologicalClassificationComputer Retrieval of Information on Scientific Projects DatabaseDataData SetFundingGene ExpressionGenesGenus MycobacteriumGrantInstitutionMethodsNebraskaPerformancePhylogenetic AnalysisProcessResearchResearch PersonnelResourcesSimulateSourceStructureTreesUnited States National Institutes of Healthfunctional genomicsimproved
项目摘要
This subproject is one of many research subprojects utilizing the
resources provided by a Center grant funded by NIH/NCRR. The subproject and
investigator (PI) may have received primary funding from another NIH source,
and thus could be represented in other CRISP entries. The institution listed is
for the Center, which is not necessarily the institution for the investigator.
Clustering algorithms are widely used in bioinformatics to classify data, as in the analysis of gene expression and in the building of phylogenetic trees. Biological data often describe parallel and spontaneous processes. To capture these features, we propose a new clustering algorithm that employs the concept of message passing. Message Passing Clustering (MPC) allows data objects to communicate with each other and produces clusters in parallel, thereby making the clustering process intrinsic. We have proved that MPC shares similarity with Hierarchical Clustering (HC) but offers significantly improved performance because it takes into account both local and global structure. We have analyzed 35 sets of simulated dynamic gene expression data, achieving a 95% hit rate in which 639 genes out of a total 674 genes were correctly clustered. We have also applied MPC to a real data set to build a phylogenic tree from aligned mycobacterium sequences. The results show higher classification accuracies as compared to traditional clustering methods such as HC.
该子项目是利用该技术的众多研究子项目之一
资源由 NIH/NCRR 资助的中心拨款提供。子项目和
研究者 (PI) 可能已从 NIH 的另一个来源获得主要资金,
因此可以在其他 CRISP 条目中表示。列出的机构是
对于中心来说,它不一定是研究者的机构。
聚类算法广泛用于生物信息学中对数据进行分类,例如基因表达分析和系统发育树的构建。生物数据通常描述并行和自发的过程。为了捕捉这些特征,我们提出了一种采用消息传递概念的新聚类算法。消息传递集群 (MPC) 允许数据对象相互通信并并行生成集群,从而使集群过程成为内在的。 我们已经证明 MPC 与层次聚类 (HC) 具有相似性,但由于它同时考虑了局部和全局结构,因此性能显着提高。 我们分析了 35 组模拟动态基因表达数据,达到了 95% 的命中率,总共 674 个基因中有 639 个基因被正确聚类。 我们还将 MPC 应用于真实数据集,以根据比对的分枝杆菌序列构建系统发育树。 结果显示,与 HC 等传统聚类方法相比,分类精度更高。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
HESHAM ALI其他文献
HESHAM ALI的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('HESHAM ALI', 18)}}的其他基金
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
- 批准号:
7725188 - 财政年份:2008
- 资助金额:
$ 3.83万 - 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
- 批准号:
7627609 - 财政年份:2007
- 资助金额:
$ 3.83万 - 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
- 批准号:
7381524 - 财政年份:2006
- 资助金额:
$ 3.83万 - 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
- 批准号:
7170750 - 财政年份:2005
- 资助金额:
$ 3.83万 - 项目类别:
相似海外基金
Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
- 批准号:
RGPIN-2019-06640 - 财政年份:2022
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Bioinformatics Algorithms for Protein Interactions and Applications
蛋白质相互作用和应用的生物信息学算法
- 批准号:
RGPIN-2021-03978 - 财政年份:2022
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
- 批准号:
RGPIN-2019-06640 - 财政年份:2021
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Bioinformatics Algorithms for Protein Interactions and Applications
蛋白质相互作用和应用的生物信息学算法
- 批准号:
RGPIN-2021-03978 - 财政年份:2021
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Bioinformatics Algorithms
生物信息学算法
- 批准号:
CRC-2017-00215 - 财政年份:2021
- 资助金额:
$ 3.83万 - 项目类别:
Canada Research Chairs
Bioinformatics Algorithms and Software for Proteomics
蛋白质组学生物信息学算法和软件
- 批准号:
RGPIN-2016-03998 - 财政年份:2021
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
- 批准号:
RGPIN-2019-06640 - 财政年份:2020
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual
Bioinformatics algorithms
生物信息学算法
- 批准号:
CRC-2017-00215 - 财政年份:2020
- 资助金额:
$ 3.83万 - 项目类别:
Canada Research Chairs
Bioinformatics algorithms
生物信息学算法
- 批准号:
CRC-2017-00215 - 财政年份:2019
- 资助金额:
$ 3.83万 - 项目类别:
Canada Research Chairs
Bioinformatics Algorithms and Software for Proteomics
蛋白质组学生物信息学算法和软件
- 批准号:
RGPIN-2016-03998 - 财政年份:2019
- 资助金额:
$ 3.83万 - 项目类别:
Discovery Grants Program - Individual