Sparse Principal Component Analysis via the Sparsest Element in a Subspace
通过子空间中最稀疏元素的稀疏主成分分析
基本信息
- 批准号:1418971
- 负责人:
- 金额:$ 13.38万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2014
- 资助国家:美国
- 起止时间:2014-09-01 至 2014-11-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Sparse principal component analysis (PCA) is a technique that allows biologists and other scientists to interpret experimental data in terms of very few variables. For example, it can help identify which among thousands of genes are important in distinguishing different types of cancer. In order for scientists and engineers to select the best algorithm for finding sparse principal components, it is important to have a theoretical understanding of the performance of many algorithms under a realistic data model. Most existing theoretical understanding focuses on the simple case where there is a single component that happens to be sparse. The proposed work will introduce a new model in which there are multiple components, of which one is sparse. For a special case of this more realistic model, the proposed work attempts to understand if there are any conditions under which sophisticated convex programs are provably better than very simple algorithms. Either outcome would be informative in helping researchers decide between the many algorithms for sparse PCA. In this project, sparse PCA will be studied from the perspective of finding the sparsest element in a subspace. This perspective is motivated by a multispike data model, which the PI calls a sparse-dense model. Under this model, the infinite data limit of sparse PCA becomes the sparsest element problem, which is nontrivial. The objective of this research is to understand the computational-statistical tradeoff in finding the sparsest element in a subspace under the sparse-dense model. The PI would like to determine if there is a scaling gap between the information theoretic limit and the best performance by a computationally efficient algorithm. Ultimately, we would like to understand when sophisticated convex methods are provably better than simple thresholding methods. This objective will be explored by semidefinite relaxations, polynomial optimization, and reductions to the planted clique problem.
稀疏主成分分析(PCA)是一种使生物学家和其他科学家可以用很少的变量来解释实验数据的技术。例如,它可以帮助确定成千上万基因在区分不同类型癌症的基因中很重要。为了使科学家和工程师选择找到稀疏主组件的最佳算法,重要的是要在现实的数据模型下对许多算法的性能有理论上的理解。大多数现有的理论理解都集中在一个简单的情况下,其中一个组件恰好是稀疏的。拟议的工作将引入一个新模型,其中有多个组件,其中一个组成部分很少。对于这种更现实的模型的特殊情况,拟议的工作试图了解是否有任何条件,在任何条件下,复杂的凸面程序比非常简单的算法要好得多。在帮助研究人员之间决定稀疏PCA的许多算法之间,这两种结果都是有益的。 在这个项目中,将从查找子空间中最稀少元素的角度研究稀疏PCA。该观点是由多功能数据模型的动机,PI称之为稀疏密集的模型。在此模型下,稀疏PCA的无限数据限制成为最稀少的元素问题,这是非平凡的。这项研究的目的是了解计算统计的权衡,以在稀疏密集模型下找到子空间中最稀少的要素。 PI希望确定信息理论限制与计算有效算法之间的最佳性能之间是否存在缩放差距。最终,我们想了解何时复杂的凸方法比简单的阈值方法更好。该目标将通过半决赛松弛,多项式优化以及对种植集团问题的减少来探索。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Paul Hand其他文献
Simultaneous Phase Retrieval and Blind Deconvolution via Convex Programming
通过凸规划进行同步相位检索和盲反卷积
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:6
- 作者:
Ali Ahmed;A. Aghasi;Paul Hand - 通讯作者:
Paul Hand
PhaseLift is robust to a constant fraction of arbitrary errors
- DOI:
10.1016/j.acha.2016.01.001 - 发表时间:
2015-02 - 期刊:
- 影响因子:2.5
- 作者:
Paul Hand - 通讯作者:
Paul Hand
Analysis of Catastrophic Forgetting for Random Orthogonal Transformation Tasks in the Overparameterized Regime
超参数化机制中随机正交变换任务的灾难性遗忘分析
- DOI:
10.48550/arxiv.2207.06475 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Daniel Goldfarb;Paul Hand - 通讯作者:
Paul Hand
Photoperiod effect on bud burst in Prunus is phase dependent: significance for early photosynthetic development.
光周期对李属芽萌发的影响是相位依赖性的:对早期光合作用发育具有重要意义。
- DOI:
10.1093/treephys/16.5.491 - 发表时间:
1996 - 期刊:
- 影响因子:4
- 作者:
R. Besford;Paul Hand;Christine M. Richardson;S. D. Peppitt - 通讯作者:
S. D. Peppitt
ShapeFit: Exact Location Recovery from Corrupted Pairwise Directions
ShapeFit:从损坏的成对方向中恢复精确位置
- DOI:
10.1002/cpa.21727 - 发表时间:
2015 - 期刊:
- 影响因子:3
- 作者:
Paul Hand;Choongbum Lee;V. Voroninski - 通讯作者:
V. Voroninski
Paul Hand的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Paul Hand', 18)}}的其他基金
Collaborative Research: CDS&E-MSS: Deep Network Compression and Continual Learning: Theory and Application
合作研究:CDS
- 批准号:
2053448 - 财政年份:2021
- 资助金额:
$ 13.38万 - 项目类别:
Continuing Grant
Foundations of Data Science Institute
数据科学研究所基础
- 批准号:
2022205 - 财政年份:2020
- 资助金额:
$ 13.38万 - 项目类别:
Continuing Grant
CAREER: Signal Recovery from Generative Priors
职业:从生成先验中恢复信号
- 批准号:
1848087 - 财政年份:2019
- 资助金额:
$ 13.38万 - 项目类别:
Continuing Grant
A Systems Approach to Disease Resistance Against Necrotrophic Fungal Pathogens
针对坏死性真菌病原体的抗病系统方法
- 批准号:
BB/M017729/1 - 财政年份:2015
- 资助金额:
$ 13.38万 - 项目类别:
Research Grant
Sparse Principal Component Analysis via the Sparsest Element in a Subspace
通过子空间中最稀疏元素的稀疏主成分分析
- 批准号:
1464525 - 财政年份:2014
- 资助金额:
$ 13.38万 - 项目类别:
Standard Grant
Accelerated breeding of black rot resistant brassicas for the benefit of east African smallholders
加速培育抗黑腐病芸苔属植物,造福东非小农
- 批准号:
BB/F004338/2 - 财政年份:2010
- 资助金额:
$ 13.38万 - 项目类别:
Research Grant
Bacterial and plant factors that influence adhesion of enterohaemorrhagic E. coli and Salmonella enterica to salad leaves
影响肠出血性大肠杆菌和沙门氏菌对沙拉叶粘附的细菌和植物因素
- 批准号:
BB/G014175/2 - 财政年份:2010
- 资助金额:
$ 13.38万 - 项目类别:
Research Grant
Bacterial and plant factors that influence adhesion of enterohaemorrhagic E. coli and Salmonella enterica to salad leaves
影响肠出血性大肠杆菌和沙门氏菌对沙拉叶粘附的细菌和植物因素
- 批准号:
BB/G014175/1 - 财政年份:2009
- 资助金额:
$ 13.38万 - 项目类别:
Research Grant
Accelerated breeding of black rot resistant brassicas for the benefit of east African smallholders
加速培育抗黑腐病芸苔属植物,造福东非小农
- 批准号:
BB/F004338/1 - 财政年份:2008
- 资助金额:
$ 13.38万 - 项目类别:
Research Grant
相似国自然基金
丹参水提物及其主要活性成分对糖尿病肾病保护作用的直接靶点和分子机制
- 批准号:82304812
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
中药甘草三类主要活性成分的生物合成系统研究
- 批准号:82330122
- 批准年份:2023
- 资助金额:220 万元
- 项目类别:重点项目
变质岩中主要变质矿物化学成分环带性质的基本规律研究及其应用
- 批准号:42330303
- 批准年份:2023
- 资助金额:230 万元
- 项目类别:重点项目
姜主要活性成分6-姜辣素通过“直接结合”与“双通路交叉调控”靶向抑制SCD1改善非酒精性脂肪肝的机制
- 批准号:82274164
- 批准年份:2022
- 资助金额:52.00 万元
- 项目类别:面上项目
何首乌致胆汁淤积肝损伤中其主要成分二苯乙烯苷的协同增强作用机制研究
- 批准号:82204622
- 批准年份:2022
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
相似海外基金
技術分野内における主流形成に地理的要因が及ぼす影響に関する研究
地理因素对技术领域主流形成的影响研究
- 批准号:
24K16349 - 财政年份:2024
- 资助金额:
$ 13.38万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Time series clustering to identify and translate time-varying multipollutant exposures for health studies
时间序列聚类可识别和转化随时间变化的多污染物暴露以进行健康研究
- 批准号:
10749341 - 财政年份:2024
- 资助金额:
$ 13.38万 - 项目类别:
The roles and mechanisms of inflammation resolution in the development of Rheumatoid Arthritis
炎症消退在类风湿关节炎发展中的作用和机制
- 批准号:
10733789 - 财政年份:2023
- 资助金额:
$ 13.38万 - 项目类别:
Personalizing Circumpapillary Retinal Nerve Fiber Layer Thickness Norms for Glaucoma
个性化青光眼环视乳头视网膜神经纤维层厚度标准
- 批准号:
10728042 - 财政年份:2023
- 资助金额:
$ 13.38万 - 项目类别: