Spectral and principal components analysis in sparse, high-dimensional data
稀疏高维数据中的谱和主成分分析
基本信息
- 批准号:1407771
- 负责人:
- 金额:$ 12万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2014
- 资助国家:美国
- 起止时间:2014-08-01 至 2017-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
With the rapid advances in data collection technology, relational data is becoming increasingly important in modern sciences. Broadly speaking, relational data records interactions and dependences among actors in a population of interest. A typical example is network data, such as social networks, world-wide-web, and terrorist networks, where each actor is represented by a node in the network and an interaction between two actors is represented by the presence of an edge between the corresponding nodes. Another common form of relational data is covariance and correlation data, which summarizes pairwise dependence among actors, such as gene-gene co-expression, functional correlation in brain imaging, and spatial correlation in atmospheric and oceanographic measurements. Such data sets often contain important structures that can provide key insights to the population of interest. For example, the population of actors in a network data may be divided into several communities with different connectivity patterns; the population in a correlation data may contain a few important actors that account for most of the observed variability. However, the high dimensionality and complex dependence structure in these data sets make it a challenging statistical problem to recover these hidden structures.This research project aims at advancing the theory and methodology in statistical inference for network and covariance data using spectral and principal components analysis. These two topics are brought together and studied using a novel set of tools recently developed in random matrix theory, spectral analysis, and empirical process theory. This project will investigate three topics. The first topic is a better understanding and refinement of community recovery in sparse network models using spectral clustering, one of the most popular methods in the literature and in practice. The second topic is network community detection in a statistical minimax framework, including information-theoretic lower bounds quantified by a comprehensive collection of model parameters, and optimal estimation procedures that achieve the lower bounds. The third topic is goodness-of-fit tests for general sparse principal components analysis models, where adaptive procedures will be developed using a detection boundary framework; and the high dimensionality challenge will be tackled by considering regular alternatives such as Sobolev ellipsoids.
随着数据收集技术的快速发展,关系数据在现代科学中变得越来越重要。一般来说,关系数据记录了感兴趣的群体中的参与者之间的交互和依赖关系。典型的示例是网络数据,诸如社交网络、万维网和恐怖分子网络,其中每个参与者由网络中的节点表示,并且两个参与者之间的交互由对应节点之间的边的存在表示。 关系数据的另一种常见形式是协方差和相关性数据,它总结了参与者之间的成对依赖关系,例如基因-基因共表达,脑成像中的功能相关性以及大气和海洋测量中的空间相关性。 这些数据集通常包含重要的结构,可以为感兴趣的人群提供关键的见解。 例如,网络数据中的参与者群体可以被划分为具有不同连接模式的几个社区;相关性数据中的群体可能包含一些重要的参与者,这些参与者占大多数观察到的可变性。 然而,这些数据集中的高维数和复杂的相关结构使得恢复这些隐藏的结构成为一个具有挑战性的统计问题,本研究旨在利用谱分析和主成分分析来提高网络和协方差数据的统计推断的理论和方法。这两个主题汇集在一起,并使用一套新的工具,最近开发的随机矩阵理论,频谱分析和经验过程理论的研究。 本项目将研究三个主题。第一个主题是更好地理解和细化稀疏网络模型中使用谱聚类,在文献和实践中最流行的方法之一的社区恢复。第二个主题是网络社区检测的统计极小极大框架,包括信息理论的下限量化的一个全面的收集模型参数,最佳估计程序,实现了下限。第三个主题是一般稀疏主成分分析模型的拟合优度测试,其中自适应程序将使用检测边界框架开发;高维挑战将通过考虑Sobolev椭球等常规替代品来解决。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jing Lei其他文献
Performances investigations of a new combined cooling, heating and power system integrated with a chemical recuperation process
与化学回收过程集成的新型冷热电联供系统的性能研究
- DOI:
- 发表时间:
- 期刊:
- 影响因子:11.2
- 作者:
Zhang Bai;Taixiu Liu;Qibin Liu;Jing Lei;L Gong;Hongguang Jin - 通讯作者:
Hongguang Jin
Tail Bounds for Matrix Quadratic Forms and Bias Adjusted Spectral Clustering in Multi-layer Stochastic Block Models
多层随机块模型中矩阵二次形式的尾界和偏差调整谱聚类
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Jing Lei - 通讯作者:
Jing Lei
The Design and Aerodynamic Investigation on a Wide-Speed Range inParallel Vehicle
宽速并联车辆的设计与气动研究
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
ShiBin Li;Wei Huang;ZhenGuo Wang;Jing Lei - 通讯作者:
Jing Lei
Marking Key Segment of Program Input via Attention Mechanism
通过注意力机制标记程序输入的关键片段
- DOI:
10.1109/access.2019.2960522 - 发表时间:
2019 - 期刊:
- 影响因子:3.9
- 作者:
Xing Zhang;Chao Feng;Runhao Li;Jing Lei;Chaojing Tang - 通讯作者:
Chaojing Tang
Convergence and concentration of empirical measures under Wasserstein distance in unbounded functional spaces
- DOI:
10.3150/19-bej1151 - 发表时间:
2018-04 - 期刊:
- 影响因子:1.5
- 作者:
Jing Lei - 通讯作者:
Jing Lei
Jing Lei的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jing Lei', 18)}}的其他基金
Theory and Methods for Modern Predictive Inference
现代预测推理的理论与方法
- 批准号:
2310764 - 财政年份:2023
- 资助金额:
$ 12万 - 项目类别:
Standard Grant
Theory and Methods for Large-Scale Multi-Modal Matrix Data
大规模多模态矩阵数据的理论与方法
- 批准号:
2015492 - 财政年份:2020
- 资助金额:
$ 12万 - 项目类别:
Standard Grant
Research on the Handwriting Trajectory Reconstruction and Recognition with Wearable Sensing Method
可穿戴传感方法的笔迹轨迹重建与识别研究
- 批准号:
18K11400 - 财政年份:2018
- 资助金额:
$ 12万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CAREER: Modernizing Classical Nonparametric and Multivariate Theory for Large-scale, High-dimensional Data Analysis
职业:现代化经典非参数和多元理论以进行大规模、高维数据分析
- 批准号:
1553884 - 财政年份:2016
- 资助金额:
$ 12万 - 项目类别:
Continuing Grant
Unconstrained energy harvesting and online behavior recognition based on ring-shape wearable device
基于环形可穿戴设备的无约束能量收集与在线行为识别
- 批准号:
26730094 - 财政年份:2014
- 资助金额:
$ 12万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似国自然基金
一维动力系统中若干问题的研究
- 批准号:11271344
- 批准年份:2012
- 资助金额:68.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
使用倾向分(Propensity Score)和主分层(Principal Stratification)进行因果推断
- 批准号:10401003
- 批准年份:2004
- 资助金额:11.0 万元
- 项目类别:青年科学基金项目
相似海外基金
SBIR Phase I: Multi-principal element alloy fillers for toughness enhancement in repair of Ni-base superalloy components
SBIR 第一阶段:用于镍基高温合金部件修复中增强韧性的多主元合金填料
- 批准号:
2208777 - 财政年份:2022
- 资助金额:
$ 12万 - 项目类别:
Standard Grant
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
10400666 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Collaborative Research: Spectral Functional Principal Components on Abelian Groups with Applications to Spatial Functional Data
合作研究:阿贝尔群的谱函数主成分及其在空间函数数据中的应用
- 批准号:
1914882 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Standard Grant
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
9906150 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
10612796 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Collaborative Research: Spectral Functional Principal Components on Abelian Groups with Applications to Spatial Functional Data
合作研究:阿贝尔群的谱函数主成分及其在空间函数数据中的应用
- 批准号:
1915277 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Standard Grant
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
10221116 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
10218324 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Clinical Research Sites for the MACS/WIHS Combined Cohort Study (MACS/WIHS-CCS)
MACS/WIHS 联合队列研究 (MACS/WIHS-CCS) 的临床研究中心
- 批准号:
10220412 - 财政年份:2019
- 资助金额:
$ 12万 - 项目类别:
Extending Functional Principal Components Analysis to Model Weight Gain and Fat Mass Accretion During Pregnancy
扩展功能主成分分析来模拟怀孕期间的体重增加和脂肪量增加
- 批准号:
528708-2018 - 财政年份:2018
- 资助金额:
$ 12万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's