CIF: Small: Cluster Analysis for Highly-correlated, Heavy-tailed, and Higher-order Data
CIF:小型:高相关、重尾和高阶数据的聚类分析
基本信息
- 批准号:1908969
- 负责人:
- 金额:$ 47.85万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2023-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Rapidly advances in modern science and technology are resulting in the generation of data sets of unprecedented sizes and complexity. A common source of complexity in data sets is the presence of subpopulations. For example, a disease may have several subtypes; and customers may be attracted by different features of the same product. Cluster analysis is a popular tool to identify subpopulations, which affords a refined investigation on each of them. This project develops novel clustering methods to reveal the increasingly complex patterns within contemporary data sets. In addition to the allocation of subjects, the clustering methods in this research further find the defining features of each subpopulation. The research team will apply these methods to various real-world problems with potential to affect multiple fields that rely on such data sets. Open source and user-friendly software will also be provided. Moreover, this project will be integrated with educational and outreach activities, including new courses, interdisciplinary training, and mentoring of underrepresented student groups in mathematical and statistical sciences. Classical clustering methods tend to be inefficient and/or inaccurate when data are highly correlated, heavy-tailed, and/or comprise higher-order tensors. To address these challenges in high-dimensional unsupervised learning problems, the investigators pursue new probabilistic models and statistical methods for clustering of large and complex data. The investigators promote parsimony in the models by the synthesis of the sparsity principle through variable selection and the dimension reduction principle through linear projections. The pursuant probabilistic frameworks enable simultaneous variable selection/dimension reduction, parameter estimation and prediction. By separating and excluding the noise in the data set, efficiency in estimation and prediction is greatly enhanced. Concurrently, parsimony in the models leads to scalable algorithms and new statistical insights.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代科学和技术的迅速进步正在导致产生前所未有的大小和复杂的数据集。数据集的复杂性的一个常见来源是子总体的存在。例如,一种疾病可能有几个亚型;客户可能会被同一产品的不同功能所吸引。聚类分析是一种流行的识别亚群体的工具,它提供了对每个亚群体的精细调查。该项目开发了新的聚类方法,以揭示当代数据集中日益复杂的模式。除了研究对象的分配外,本研究中的聚类方法还进一步发现了每个子群体的定义特征。研究小组将把这些方法应用于各种现实世界的问题,这些问题可能会影响依赖这些数据集的多个领域。还将提供开源和用户友好的软件。此外,该项目还将与教育和宣传活动结合起来,包括新课程、跨学科培训以及对数学和统计科学中任职人数不足的学生群体进行辅导。当数据高度相关、重尾和/或包含高阶张量时,经典的聚类方法往往效率低下和/或不准确。为了解决高维无监督学习问题中的这些挑战,研究人员寻求新的概率模型和统计方法来对大数据和复杂数据进行聚类。研究人员通过变量选择的稀疏性原则和线性投影的降维原则的综合来促进模型的简约性。随之而来的概率框架使变量选择/降维、参数估计和预测能够同时进行。通过分离和排除数据集中的噪声,大大提高了估计和预测的效率。同时,模型中的简约导致了可扩展的算法和新的统计见解。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Efficient Convex Formulation for Reduced-Rank Linear Discriminant Analysis in High Dimensions
高维降阶线性判别分析的高效凸公式
- DOI:10.5705/ss.202021.0047
- 发表时间:2023
- 期刊:
- 影响因子:1.4
- 作者:Zeng, Jing;Zhang, Xin;Mai, Qing
- 通讯作者:Mai, Qing
Model-based clustering with envelopes
- DOI:10.1214/19-ejs1652
- 发表时间:2020-01
- 期刊:
- 影响因子:1.1
- 作者:Wenjing Wang;Xin Zhang;Qing Mai
- 通讯作者:Wenjing Wang;Xin Zhang;Qing Mai
The robust nearest shrunken centroids classifier for high-dimensional heavy-tailed data
- DOI:10.1214/22-ejs2022
- 发表时间:2022-01
- 期刊:
- 影响因子:1.1
- 作者:Shaokang Ren;Qing Mai
- 通讯作者:Shaokang Ren;Qing Mai
Envelopes and principal component regression
- DOI:10.1214/23-ejs2154
- 发表时间:2022-07
- 期刊:
- 影响因子:1.1
- 作者:Xin Zhang;Kai Deng;Qing Mai
- 通讯作者:Xin Zhang;Kai Deng;Qing Mai
Tensor envelope mixture model for simultaneous clustering and multiway dimension reduction
- DOI:10.1111/biom.13486
- 发表时间:2021-05
- 期刊:
- 影响因子:1.9
- 作者:Kai Deng;Xin Zhang
- 通讯作者:Kai Deng;Xin Zhang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Qing Mai其他文献
Coordinatewise Gaussianization: Theories and Applications
坐标高斯化:理论与应用
- DOI:
10.1080/01621459.2022.2044825 - 发表时间:
2022-02 - 期刊:
- 影响因子:3.7
- 作者:
Qing Mai;Di He;Hui Zou - 通讯作者:
Hui Zou
Tensor mixture discriminant analysis with applications to sensor array data analysis
张量混合判别分析及其在传感器阵列数据分析中的应用
- DOI:
10.1214/23-aoas1804 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Xuesong Hou;Qing Mai;Hui Zou - 通讯作者:
Hui Zou
Supplementary Material for “Slicing-free Inverse Regression in High-dimensional Sufficient Dimension Reduction”
“高维充分降维中的无切片逆回归”补充材料
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Qing Mai;Xiaofeng Shao;Runmin Wang;Xin Zhang - 通讯作者:
Xin Zhang
Qing Mai的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Development of catalytic reactions over novel supported ultra-small cluster catalysts and contribution to CO2 emission reduction
新型负载型超小簇催化剂催化反应的发展及其对二氧化碳减排的贡献
- 批准号:
23K04772 - 财政年份:2023
- 资助金额:
$ 47.85万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collaborative manufacturing and small scale automation in the Active Food Cluster
活性食品集群中的协作制造和小规模自动化
- 批准号:
10075402 - 财政年份:2023
- 资助金额:
$ 47.85万 - 项目类别:
Grant for R&D
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPIN-2019-06570 - 财政年份:2022
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Individual
Development of the reactive cluster sites operating multi-centered activation and multi-electron transfer oriented to resource utilization of inert small molecules
开发面向惰性小分子资源利用的多中心活化和多电子转移反应簇位点
- 批准号:
22K05184 - 财政年份:2022
- 资助金额:
$ 47.85万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPIN-2019-06570 - 财政年份:2021
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Individual
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPIN-2019-06570 - 财政年份:2020
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Individual
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPAS-2019-00060 - 财政年份:2020
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Accelerator Supplements
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPAS-2019-00060 - 财政年份:2019
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Accelerator Supplements
Star Cluster Evolution: Near and Far, Large and Small, Old and Young
星团演化:近与远、大与小、老与年轻
- 批准号:
RGPIN-2019-06570 - 财政年份:2019
- 资助金额:
$ 47.85万 - 项目类别:
Discovery Grants Program - Individual
SHF: Small: Lightweight Virtualization Driven Elastic Memory Management and Cluster Scheduling
SHF:小型:轻量级虚拟化驱动的弹性内存管理和集群调度
- 批准号:
1816850 - 财政年份:2018
- 资助金额:
$ 47.85万 - 项目类别:
Standard Grant