CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING

使用消息传递对生物数据进行聚类

基本信息

  • 批准号:
    7627609
  • 负责人:
  • 金额:
    $ 4.4万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-05-01 至 2008-04-30
  • 项目状态:
    已结题

项目摘要

This subproject is one of many research subprojects utilizing the resources provided by a Center grant funded by NIH/NCRR. The subproject and investigator (PI) may have received primary funding from another NIH source, and thus could be represented in other CRISP entries. The institution listed is for the Center, which is not necessarily the institution for the investigator. Clustering algorithms are widely used in bioinformatics to classify data, as in the analysis of gene expression and in the building of phylogenetic trees. Biological data often describe parallel and spontaneous processes. To capture these features, we propose a new clustering algorithm that employs the concept of message passing. Message Passing Clustering (MPC) allows data objects to communicate with each other and produces clusters in parallel, thereby making the clustering process intrinsic. We have proved that MPC shares similarity with Hierarchical Clustering (HC) but offers significantly improved performance because it takes into account both local and global structure. We have analyzed 35 sets of simulated dynamic gene expression data, achieving a 95% hit rate in which 639 genes out of a total 674 genes were correctly clustered. We have also applied MPC to a real data set to build a phylogenic tree from aligned mycobacterium sequences. The results show higher classification accuracies as compared to traditional clustering methods such as HC.
这个子项目是许多研究子项目中的一个 由NIH/NCRR资助的中心赠款提供的资源。子项目和 研究者(PI)可能从另一个NIH来源获得了主要资金, 因此可以在其他CRISP条目中表示。所列机构为 研究中心,而研究中心不一定是研究者所在的机构。 聚类算法在生物信息学中被广泛用于对数据进行分类,如在基因表达的分析和系统发育树的构建中。生物学数据通常描述平行和自发的过程。为了捕捉这些功能,我们提出了一个新的聚类算法,采用消息传递的概念。消息传递聚类(MPC)允许数据对象相互通信并并行产生聚类,从而使聚类过程成为内在的。 我们已经证明,MPC股相似的层次聚类(HC),但提供了显着改善的性能,因为它考虑到本地和全球的结构。 我们已经分析了35组模拟的动态基因表达数据,达到了95%的命中率,其中639个基因,共674个基因被正确聚类。 我们还将MPC应用于真实的数据集,以从比对的分枝杆菌序列构建基因树。 结果表明,更高的分类精度相比,传统的聚类方法,如HC。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

HESHAM ALI其他文献

HESHAM ALI的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('HESHAM ALI', 18)}}的其他基金

UNO: BIOINFORMATICS CORE
UNO:生物信息学核心
  • 批准号:
    8360030
  • 财政年份:
    2011
  • 资助金额:
    $ 4.4万
  • 项目类别:
UNO: BIOINFORMATICS CORE
UNO:生物信息学核心
  • 批准号:
    8167517
  • 财政年份:
    2010
  • 资助金额:
    $ 4.4万
  • 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
  • 批准号:
    7960264
  • 财政年份:
    2009
  • 资助金额:
    $ 4.4万
  • 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
  • 批准号:
    7725188
  • 财政年份:
    2008
  • 资助金额:
    $ 4.4万
  • 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
  • 批准号:
    7381524
  • 财政年份:
    2006
  • 资助金额:
    $ 4.4万
  • 项目类别:
CLUSTERING BIOLOGICAL DATA USING MESSAGE PASSING
使用消息传递对生物数据进行聚类
  • 批准号:
    7170750
  • 财政年份:
    2005
  • 资助金额:
    $ 4.4万
  • 项目类别:

相似海外基金

Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
  • 批准号:
    RGPIN-2019-06640
  • 财政年份:
    2022
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Bioinformatics Algorithms for Protein Interactions and Applications
蛋白质相互作用和应用的生物信息学算法
  • 批准号:
    RGPIN-2021-03978
  • 财政年份:
    2022
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
  • 批准号:
    RGPIN-2019-06640
  • 财政年份:
    2021
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Bioinformatics Algorithms for Protein Interactions and Applications
蛋白质相互作用和应用的生物信息学算法
  • 批准号:
    RGPIN-2021-03978
  • 财政年份:
    2021
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Bioinformatics Algorithms
生物信息学算法
  • 批准号:
    CRC-2017-00215
  • 财政年份:
    2021
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Canada Research Chairs
Bioinformatics Algorithms and Software for Proteomics
蛋白质组学生物信息学算法和软件
  • 批准号:
    RGPIN-2016-03998
  • 财政年份:
    2021
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Novel Data Structures And Scalable Algorithms For High Throughput Bioinformatics
高通量生物信息学的新颖数据结构和可扩展算法
  • 批准号:
    RGPIN-2019-06640
  • 财政年份:
    2020
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
Bioinformatics algorithms
生物信息学算法
  • 批准号:
    CRC-2017-00215
  • 财政年份:
    2020
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Canada Research Chairs
Bioinformatics algorithms
生物信息学算法
  • 批准号:
    CRC-2017-00215
  • 财政年份:
    2019
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Canada Research Chairs
Bioinformatics Algorithms and Software for Proteomics
蛋白质组学生物信息学算法和软件
  • 批准号:
    RGPIN-2016-03998
  • 财政年份:
    2019
  • 资助金额:
    $ 4.4万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了