Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
基本信息
- 批准号:250344-2011
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2015
- 资助国家:加拿大
- 起止时间:2015-01-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Clustering is one of the major unsupervised data mining methods facing severe challenges when applied to today's high-dimensional data sets, which are collected on a large scale by automatic equipment (e.g. microarray chips, sensors, logging devices). The sparsity of the data, the small variance of distances in the full-dimensional space, and the inclusion of a large number of "irrelevant" or "random" dimensions make it typically impossible to detect a meaningful clustering structure using standard clustering algorithms with common full-dimensional (dis-)similarity measures. Meaningful structure can rather be detected by either considering lower-dimensional subspaces, or, by taking into account background knowledge if it is available (often as "must-link" or "cannot-link" constraints for a small subset of data points) to guide an algorithm to a certain clustering structure that is consistent with this information - overriding to some extent the information derived in the full-dimensional space.
Main objectives of the proposed research program:
1) Advancement of the theoretical understanding of clustering methods applied to today's very high-dimensional data sets, particularly for the following relatively recent approaches "projected (or subspace-) clustering" and "semi-supervised clustering".
2) Development of novel and improved algorithms for projected and semi-supervised clustering, overcoming some of their current limitations, extending their applicability, and also combining the concepts of both for a wider range of application areas where such clustering methods can be useful.
3) Demonstration of the usefulness of the proposed methods on some real world data sets including gene expression data, text data, and medical image plus clinical data.
聚类是一种主要的无监督数据挖掘方法,在应用于当今由自动化设备(如微阵列芯片、传感器、记录设备)大规模收集的高维数据集时,面临着严峻的挑战。数据的稀疏性、全维空间中距离的小的方差、以及包括大量“不相关的”或“随机的”维度使得通常不可能使用具有普通的全维(非)相似性度量的标准聚类算法来检测有意义的聚类结构。更确切地说,可以通过考虑较低维子空间,或者通过考虑背景知识是否可用(通常作为数据点的一个小子集的“必须链接”或“不能链接”约束)来检测有意义的结构,以将算法引导到与该信息一致的特定集群结构--在一定程度上覆盖在全维空间中导出的信息。
拟议研究计划的主要目标:
1)促进了对适用于当今高维数据集的聚类方法的理论理解,特别是对于以下相对较新的方法:投影(或子空间)聚类和半监督聚类。
2)发展新的和改进的投影和半监督聚类算法,克服它们目前的一些局限性,扩展它们的适用性,并将两者的概念结合起来,用于更广泛的应用领域,在这些领域,这种聚类方法是有用的。
3)在实际数据集(包括基因表达数据、文本数据和医学图像加临床数据)上验证了所提方法的有效性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sander, Jörg其他文献
Sander, Jörg的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sander, Jörg', 18)}}的其他基金
Finding Groups in Big Data
在大数据中寻找群体
- 批准号:
RGPIN-2016-04850 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
- 批准号:
RGPIN-2016-04850 - 财政年份:2019
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
- 批准号:
RGPIN-2016-04850 - 财政年份:2018
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
- 批准号:
RGPIN-2016-04850 - 财政年份:2017
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Finding Groups in Big Data
在大数据中寻找群体
- 批准号:
RGPIN-2016-04850 - 财政年份:2016
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
- 批准号:
250344-2011 - 财政年份:2014
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
- 批准号:
412377-2011 - 财政年份:2013
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Accelerator Supplements
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
- 批准号:
250344-2011 - 财政年份:2013
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Projected and semi-supervised clustering for high-dimensional data
高维数据的投影和半监督聚类
- 批准号:
250344-2011 - 财政年份:2012
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Grants Program - Individual
Finding significant temporal and spatial patterns in industrial process data
寻找工业过程数据中重要的时间和空间模式
- 批准号:
412198-2011 - 财政年份:2012
- 资助金额:
$ 2.11万 - 项目类别:
Collaborative Research and Development Grants
相似国自然基金
DoS攻击下Semi-Markov跳变拓扑结构网络化协同运动系统预测控制研究
- 批准号:
- 批准年份:2024
- 资助金额:15.0 万元
- 项目类别:省市级项目
隐semi-Markov过程驱动的双时间尺度时滞系统有限时间控制
- 批准号:62303016
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
具有脉冲效应的正semi-Markov跳变系统的分析与控制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
广义离散网络semi-Markov跳变系统的事件触发滑模控制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于semi-Markov过程的奇异摄动模糊跳变系统分析与综合
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
不确定非齐次semi-Markov跳变系统的约束预测控制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
复杂受限的semi-Markov跳变系统控制与滤波
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于semi-Markov理论的含多类型异质能源微电网态势感知研究
- 批准号:
- 批准年份:2020
- 资助金额:57 万元
- 项目类别:面上项目
旋转对称密码函数的构造和分析
- 批准号:61902314
- 批准年份:2019
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
Semi-Markovian切换系统的动态滑模控制及逗留时间和模式依赖滑模控制器研究
- 批准号:61973075
- 批准年份:2019
- 资助金额:59.0 万元
- 项目类别:面上项目
相似海外基金
SHF: Small: Semi-supervised Learning for Design and Quality Assurance of Integrated Circuits
SHF:小型:集成电路设计和质量保证的半监督学习
- 批准号:
2334380 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Standard Grant
CAP: Semi-supervised Fairness-Enhanced Knowledge Graph Construction on Social Media for AI-Enhanced Juvenile Justice
CAP:社交媒体上的半监督公平增强知识图谱构建,用于人工智能增强少年司法
- 批准号:
2323419 - 财政年份:2023
- 资助金额:
$ 2.11万 - 项目类别:
Standard Grant
A Novel Approach to Semi-Supervised Statistical Machine Learning
半监督统计机器学习的新方法
- 批准号:
DP230101671 - 财政年份:2023
- 资助金额:
$ 2.11万 - 项目类别:
Discovery Projects
Distributed Graph-based Semi-supervised Classifiers: Sampling and Interpolation
基于分布式图的半监督分类器:采样和插值
- 批准号:
551992-2020 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Alliance Grants
Towards Open-world Semi-supervised learning
走向开放世界的半监督学习
- 批准号:
2766068 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Studentship
Clustering and semi-supervised learning on large heterogeneous graphs: Mathematical formulations and numerical optimization algorithms
大型异构图上的聚类和半监督学习:数学公式和数值优化算法
- 批准号:
569398-2022 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
- 批准号:
10463080 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Theory-based Measurement of Varieties of Power Using a Novel Semi-supervised IRT Model
使用新型半监督 IRT 模型对各种功率进行基于理论的测量
- 批准号:
2148904 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Standard Grant
Development of Semi-Supervised Learning Method using Compressed Video for Real-Time Animal Behavior Analysis
使用压缩视频进行实时动物行为分析的半监督学习方法的开发
- 批准号:
22H03637 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Myc Transcription Factor Inhibitor Design: Integrating Atomic and Mesoscale with Semi-Supervised Generative Deep Learning Models
Myc 转录因子抑制剂设计:将原子和中尺度与半监督生成深度学习模型相结合
- 批准号:
10745272 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:














{{item.name}}会员




