Nonparametric Cluster Analysis

非参数聚类分析

基本信息

  • 批准号:
    0505824
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2005
  • 资助国家:
    美国
  • 起止时间:
    2005-06-15 至 2009-05-31
  • 项目状态:
    已结题

项目摘要

The investigator studies the problem of finding groups in data("clustering"). Most existing clustering methods make implicit orexplicit assumptions about the shapes of the groups, for example thatthe groups are roughly spherical or Gaussian, and they will fail ifthese assumptions are violated. The goal of the project is to develop(i) nonparametric clustering methods capable of finding groups ofarbitrary shape; (ii) methods for assessing the statistical validityof the clusters; (iii) tools for visualizing the results. Clusteringis cast as a statistical rather than a purely algorithmic problem. Theobserved data are regarded as a sample from some underlyingpopulation, and the goal is to estimate a well defined targetcharacteristic of the population - the cluster tree - from thesample. Adopting a statistical view of clustering has two benefits:(i) it allows comparing the performance of different methods; (ii) itgives meaning to the notion of "cluster validity". Without a samplingmodel and a target characteristic of the population the questionwhether clusters are valid or spurious is meaningless. The proposedmethod for estimating the population cluster tree is based onanalyzing a graph over the sample but, unlike most other graph-basedclustering methods, it is motivated by the underlying statisticalestimation problem. Assessing cluster validity - determining thenumber of distinct groups, with "one" as a possible answer - hasproven a vexing problem, especially in the absence of prior knowledgeor assumptions about group shapes. The investigator proposes a novelapproach to this problem based on resampling.Finding groups in data is a problem that occurs in many areas, fromgenomics (identifying groups of genes with similar function based ongene expression levels measured by DNA microarrays) to informationretrieval (spotting topics in document collections) to marketing(determining distinct groups of customers with similarcharacteristics). Clustering is an exploratory tool, and theretypically is little or no prior information about the shapes or thenumber of groups. It is therefore important to have methods thatautomatically determine the number of groups and do not rely onassumptions about their shape, and visualization tools that help inunderstanding the shapes of the groups, their arrangement in featurespace, and the influence of parameters of the clustering method on theresults.
调查者研究在数据中发现组的问题(“聚类”)。大多数现有的聚类方法对组的形状做了隐式或显式的假设,例如,组大致是球形或高斯的,如果违反这些假设,它们将失败。该项目的目标是开发(1)能够找到任意形状的分组的非参数聚类法;(2)评估分组的统计有效性的方法;(3)可视化结果的工具。聚类被认为是一个统计问题,而不是纯粹的算法问题。将观测到的数据作为潜在群体的样本,目标是从样本中估计一个明确定义的群体目标特征--聚类树。采用集群的统计观点有两个好处:(I)它允许比较不同方法的性能;(Ii)它赋予了“集群有效性”这一概念的意义。如果没有抽样模型和群体的目标特征,关于聚类是否有效或虚假的问题就没有意义。所提出的估计种群聚类树的方法是基于对样本上的图的分析,但与大多数其他基于图的聚类方法不同的是,它是由潜在的统计估计问题驱动的。评估集群的有效性--确定不同群体的数量,并用“1”作为可能的答案--已被证明是一个令人烦恼的问题,特别是在缺乏关于群体形状的先验知识或假设的情况下。研究人员提出了一种基于重采样的新方法来解决这个问题。在数据中找到组是一个在许多领域都存在的问题,从基因组学(根据DNA微阵列测量的基因表达水平确定具有相似功能的基因组)到信息检索(发现文档集合中的主题)到营销(确定具有相似特征的不同客户组)。聚类是一种探索性工具,通常很少或根本没有关于群的形状或数量的先验信息。因此,重要的是要有自动确定组的数量且不依赖于对其形状的假设的方法,以及帮助理解组的形状、其在特征空间中的排列以及聚类法的参数对结果的影响的可视化工具。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Werner Stuetzle其他文献

Werner Stuetzle的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Werner Stuetzle', 18)}}的其他基金

3D Scanning: Acquiring and Modeling Surface Properties
3D 扫描:获取和建模表面属性
  • 批准号:
    9803226
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Mathematical Sciences: 3D Scanning: From Physical Objects to Electronic Models
数学科学:3D 扫描:从物理对象到电子模型
  • 批准号:
    9402734
  • 财政年份:
    1994
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Mathematical Sciences: Data Visualization using Focusing andLinking
数学科学:使用聚焦和链接进行数据可视化
  • 批准号:
    9114027
  • 财政年份:
    1992
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Mathematical Sciences: Nonparametric Methods in MultivariateAnalysis
数学科学:多元分析中的非参数方法
  • 批准号:
    8504359
  • 财政年份:
    1985
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant

相似国自然基金

FXR1 通过相分离介导外泌体装载 miR-17- 92 cluster 影响淋巴瘤免疫耐药的机制研究
  • 批准号:
    BY24H080014
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
面向CMOS像素探测器片上集成的cluster实时找寻算法和电路结构研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miR-199a/214 cluster 协同 Nimotuzumab 调控前列腺癌转移的机制研究
  • 批准号:
    2021JJ70015
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
MiR-17-92 cluster介导的ACVR1泛素化失调在肿瘤相关巨噬细胞诱导的肝细胞肝癌侵袭中的作用机制探讨
  • 批准号:
    82002601
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
FoxO/miR-17-92 cluster/p16轴在骨关节炎软骨细胞衰老中的作用 及机制研究
  • 批准号:
    81902246
  • 批准年份:
    2019
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
miR-17-92 cluster调控幼年海马神经发生在微波辐射致认知功能损伤中作用的基础研究
  • 批准号:
    31971163
  • 批准年份:
    2019
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
microRNA-17-92cluster通过mTORC1/decorin通路调控毛囊干细胞微环境及生长期启动的作用研究
  • 批准号:
    81972955
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
NF-κB/miR-130b-301b cluster/USP13信号轴介导PTEN蛋白降解促进膀胱癌进展的机制研究
  • 批准号:
    81702505
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
MicroRNA-17-92 cluster 缓释微球组织工程化神经移植物的构建及其应用于修复大鼠周围神经缺损的研究
  • 批准号:
    81771999
  • 批准年份:
    2017
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
miR-17~92 cluster 调控VSMC表型转化在移植静脉术后再狭窄中的作用及机制研究
  • 批准号:
    81700320
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Improving the design and statistical analysis of cluster-randomized trials on tropical infectious diseases
改进热带传染病整群随机试验的设计和统计分析
  • 批准号:
    10570440
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Elucidation of magnetic cluster dynamics by developing a dynamic magnetic pair-density function analysis method
通过开发动态磁对密度函数分析方法来阐明磁团簇动力学
  • 批准号:
    22K04678
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Robust framework for cluster analysis of multivariate discrete data
多元离散数据聚类分析的稳健框架
  • 批准号:
    573564-2022
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    University Undergraduate Student Research Awards
Dissociation/ionization process of organic molecules by cluster ion collisions and application to molecular structure analysis
簇离子碰撞有机分子的解离/电离过程及其在分子结构分析中的应用
  • 批准号:
    22K04931
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Fostering Structural Health Monitoring of Existing Infrastructures by Coupling Damage Cluster Analysis and Scanning Laser Doppler Vibrometry
通过耦合损伤聚类分析和扫描激光多普勒测振法​​促进现有基础设施的结构健康监测
  • 批准号:
    RTI-2023-00249
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Research Tools and Instruments
Characterizing alcohol use disorder recovery-related exposures on Twitter: Content, cluster, and network analysis
描述 Twitter 上与酒精使用障碍恢复相关的暴露特征:内容、聚类和网络分析
  • 批准号:
    10572265
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Characterizing alcohol use disorder recovery-related exposures on Twitter: Content, cluster, and network analysis
描述 Twitter 上与酒精使用障碍恢复相关的暴露特征:内容、聚类和网络分析
  • 批准号:
    10934623
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Cluster analysis and pattern recognition of codesharing practices in the airline industry
航空业代码共享实践的聚类分析和模式识别
  • 批准号:
    568468-2022
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Postdoctoral Fellowships
An innovative instrument cluster for the integrative behavioral analysis of mouse mutants with perturbed neuronal connectivity
用于对神经元连接受到干扰的小鼠突变体进行综合行为分析的创新仪器组
  • 批准号:
    10176986
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Design of manufacturing systems for product variety using cluster and statistical analysis
使用聚类和统计分析设计产品多样性的制造系统
  • 批准号:
    RGPIN-2017-04858
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了