Projected and semi-supervised clustering for high-dimensional data

高维数据的投影和半监督聚类

基本信息

  • 批准号:
    250344-2011
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2015
  • 资助国家:
    加拿大
  • 起止时间:
    2015-01-01 至 2016-12-31
  • 项目状态:
    已结题

项目摘要

Clustering is one of the major unsupervised data mining methods facing severe challenges when applied to today's high-dimensional data sets, which are collected on a large scale by automatic equipment (e.g. microarray chips, sensors, logging devices). The sparsity of the data, the small variance of distances in the full-dimensional space, and the inclusion of a large number of "irrelevant" or "random" dimensions make it typically impossible to detect a meaningful clustering structure using standard clustering algorithms with common full-dimensional (dis-)similarity measures. Meaningful structure can rather be detected by either considering lower-dimensional subspaces, or, by taking into account background knowledge if it is available (often as "must-link" or "cannot-link" constraints for a small subset of data points) to guide an algorithm to a certain clustering structure that is consistent with this information - overriding to some extent the information derived in the full-dimensional space. Main objectives of the proposed research program: 1) Advancement of the theoretical understanding of clustering methods applied to today's very high-dimensional data sets, particularly for the following relatively recent approaches "projected (or subspace-) clustering" and "semi-supervised clustering". 2) Development of novel and improved algorithms for projected and semi-supervised clustering, overcoming some of their current limitations, extending their applicability, and also combining the concepts of both for a wider range of application areas where such clustering methods can be useful. 3) Demonstration of the usefulness of the proposed methods on some real world data sets including gene expression data, text data, and medical image plus clinical data.
聚类是主要的无监督数据挖掘方法之一,当应用于今天的高维数据集时面临着严峻的挑战,这些数据集是由自动设备(例如微阵列芯片,传感器,记录设备)大规模收集的。数据的稀疏性、全维空间中距离的小方差以及包含大量“不相关”或“随机”维度使得通常不可能使用具有常见全维(不)相似性度量的标准聚类算法来检测有意义的聚类结构。有意义的结构可以通过考虑低维子空间来检测,或者通过考虑背景知识(如果它是可用的)(通常作为数据点的小子集的“必须链接”或“不能链接”约束)来指导算法到与此信息一致的某个聚类结构-在某种程度上覆盖全维空间中导出的信息。 拟议研究计划的主要目标: 1)对应用于当今非常高维数据集的聚类方法的理论理解的进步,特别是对于以下相对较新的方法“投影(或子空间)聚类”和“半监督聚类”。 2)开发用于投影和半监督聚类的新的和改进的算法,克服它们当前的一些限制,扩展它们的适用性,并将两者的概念结合起来,用于更广泛的应用领域,这些聚类方法可以是有用的。 3)在一些真实的世界数据集,包括基因表达数据,文本数据,医学图像和临床数据上证明所提出的方法的有用性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sander, Jörg其他文献

Sander, Jörg的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sander, Jörg', 18)}}的其他基金

Finding Groups in Big Data
在大数据中寻找群体
  • 批准号:
    RGPIN-2016-04850
  • 财政年份:
    2021
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
  • 批准号:
    RGPIN-2016-04850
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
  • 批准号:
    RGPIN-2016-04850
  • 财政年份:
    2018
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
  • 批准号:
    RGPIN-2016-04850
  • 财政年份:
    2017
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
  • 批准号:
    RGPIN-2016-04850
  • 财政年份:
    2016
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
  • 批准号:
    250344-2011
  • 财政年份:
    2014
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
  • 批准号:
    412377-2011
  • 财政年份:
    2013
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
  • 批准号:
    250344-2011
  • 财政年份:
    2013
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
  • 批准号:
    250344-2011
  • 财政年份:
    2012
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Finding significant temporal and spatial patterns in industrial process data
寻找工业过程数据中重要的时间和空间模式
  • 批准号:
    412198-2011
  • 财政年份:
    2012
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Collaborative Research and Development Grants

相似国自然基金

DoS攻击下Semi-Markov跳变拓扑结构网络化协同运动系统预测控制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
隐semi-Markov过程驱动的双时间尺度时滞系统有限时间控制
  • 批准号:
    62303016
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
具有脉冲效应的正semi-Markov跳变系统的分析与控制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
广义离散网络semi-Markov跳变系统的事件触发滑模控制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于semi-Markov过程的奇异摄动模糊跳变系统分析与综合
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
不确定非齐次semi-Markov跳变系统的约束预测控制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
复杂受限的semi-Markov跳变系统控制与滤波
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于semi-Markov理论的含多类型异质能源微电网态势感知研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
旋转对称密码函数的构造和分析
  • 批准号:
    61902314
  • 批准年份:
    2019
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
Semi-Markovian切换系统的动态滑模控制及逗留时间和模式依赖滑模控制器研究
  • 批准号:
    61973075
  • 批准年份:
    2019
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目

相似海外基金

SHF: Small: Semi-supervised Learning for Design and Quality Assurance of Integrated Circuits
SHF:小型:集成电路设计和质量保证的半监督学习
  • 批准号:
    2334380
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
CAP: Semi-supervised Fairness-Enhanced Knowledge Graph Construction on Social Media for AI-Enhanced Juvenile Justice
CAP:社交媒体上的半监督公平增强知识图谱构建,用于人工智能增强少年司法
  • 批准号:
    2323419
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
A Novel Approach to Semi-Supervised Statistical Machine Learning
半监督统计机器学习的新方法
  • 批准号:
    DP230101671
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Projects
Distributed Graph-based Semi-supervised Classifiers: Sampling and Interpolation
基于分布式图的半监督分类器:采样和插值
  • 批准号:
    551992-2020
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Alliance Grants
Towards Open-world Semi-supervised learning
走向开放世界的半监督学习
  • 批准号:
    2766068
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Studentship
Clustering and semi-supervised learning on large heterogeneous graphs: Mathematical formulations and numerical optimization algorithms
大型异构图上的聚类和半监督学习:数学公式和数值优化算法
  • 批准号:
    569398-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
  • 批准号:
    10463080
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
Theory-based Measurement of Varieties of Power Using a Novel Semi-supervised IRT Model
使用新型半监督 IRT 模型对各种功率进行基于理论的测量
  • 批准号:
    2148904
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
Development of Semi-Supervised Learning Method using Compressed Video for Real-Time Animal Behavior Analysis
使用压缩视频进行实时动物行为分析的半监督学习方法的开发
  • 批准号:
    22H03637
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
  • 批准号:
    10745272
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了