Statistical, Computational and Algorithmic Aspects of Kernel Clustering

核聚类的统计、计算和算法方面

基本信息

项目摘要

Clustering is one of the fundamental problems in data analysis, and kernel clustering algorithms are among the most popular clustering techniques. Kernel clustering algorithms can find latent groups in complex data from pairwise similarities among the data, computed using a pre-defined kernel function. Kernel methods are based on the mathematical theory of reproducing kernels, which helps in theoretically analysing the statistical performance of these methods, particularly in the context of supervised machine learning. In comparison, there is little mathematical understanding of the role of kernels in clustering. This project addresses the deficit of understanding of kernel clustering. In particular, this project combines mathematical and numerical research to answer three key questions on kernel clustering: (1) What kind of underlying cluster structures can be statistically recovered by kernel clustering? (2) How do efficient kernel clustering algorithms perform on large datasets? (3) What is the connection between kernel clustering and other clustering approaches? To answer these questions, the project will provide theoretical research on the statistical guarantees of kernel clustering for planted cluster recovery, statistical-computational tradeoff of kernel clustering, and connections between kernel clustering and distribution based clustering. As a consequence of the theoretical study, the project will also develop new computationally efficient and interpretable clustering algorithms. Furthermore, given the recently established role of kernel theory in the analysis of supervised machine learning and deep learning, this project provides a building block for a deeper understanding of modern clustering and unsupervised learning algorithms.
聚类是数据分析中的基本问题之一,内核聚类算法是最受欢迎的聚类技术之一。内核聚类算法可以从数据之间的成对相似性中找到复杂数据中的潜在组,并使用预定义的内核函数计算。内核方法基于复制核的数学理论,该理论有助于从理论上分析这些方法的统计性能,尤其是在监督机器学习的背景下。相比之下,对核在聚类中的作用几乎没有数学理解。该项目解决了对内核聚类的理解的不足。特别是,该项目结合了数学和数值研究,以回答有关内核聚类的三个关键问题:(1)可以通过内核聚类在统计上恢复哪种基础群集结构? (2)有效的内核聚类算法如何在大型数据集上执行? (3)内核聚类与其他聚类方法之间有什么联系?为了回答这些问题,该项目将提供有关内核聚类的统计保证的理论研究,用于种植集群恢复,内核聚类的统计计算折衷以及内核聚类与基于分布的聚类之间的连接。 由于理论研究的结果,该项目还将开发新的计算高效且可解释的聚类算法。此外,鉴于内核理论在监督机器学习和深度学习分析中的最近确定的作用,该项目为对现代聚类和无监督学习算法的更深入了解提供了一个基础。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Debarghya Ghoshdastidar, Ph.D.其他文献

Professor Debarghya Ghoshdastidar, Ph.D.的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Debarghya Ghoshdastidar, Ph.D.', 18)}}的其他基金

Statistical Foundations of Unsupervised and Semi-supervised Deep Learning
无监督和半监督深度学习的统计基础
  • 批准号:
    463402401
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes

相似国自然基金

基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
  • 批准号:
    82304250
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数字金融算法统计歧视和轴辐算法合谋治理对消费者权益保护效果的计算实验研究
  • 批准号:
    72103060
  • 批准年份:
    2021
  • 资助金额:
    24.00 万元
  • 项目类别:
    青年科学基金项目
数字金融算法统计歧视和轴辐算法合谋治理对消费者权益保护效果的计算实验研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
雾霾与典型疾病复杂关联的统计计算与动力学模型研究
  • 批准号:
    61772017
  • 批准年份:
    2017
  • 资助金额:
    51.0 万元
  • 项目类别:
    面上项目
SPECT/CT成像与图像重建的数学建模及快速科学计算方法
  • 批准号:
    11601537
  • 批准年份:
    2016
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Deep Learning Image Analysis Algorithms to Improve Oral Cancer Risk Assessment for Oral Potentially Malignant Disorders
深度学习图像分析算法可改善口腔潜在恶性疾病的口腔癌风险评估
  • 批准号:
    10805177
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Deep Learning Image Analysis Algorithms to Improve Oral Cancer Risk Assessment for Oral Potentially Malignant Disorders
深度学习图像分析算法可改善口腔潜在恶性疾病的口腔癌风险评估
  • 批准号:
    10430122
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Developing computational algorithms for histopathological image analysis
开发组织病理学图像分析的计算算法
  • 批准号:
    10314050
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Developing novel algorithms for spatial molecular profiling technologies
开发空间分子分析技术的新算法
  • 批准号:
    10197672
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Developing novel algorithms for spatial molecular profiling technologies
开发空间分子分析技术的新算法
  • 批准号:
    10457848
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了