Bridging the Gap Between Theory and Applications: Robust and Scalable Statistical Estimation

弥合理论与应用之间的差距:稳健且可扩展的统计估计

基本信息

  • 批准号:
    1712956
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

Major challenges in modern data-rich environment require new statistical algorithms that succeed under realistic scenarios and model assumptions, such as estimation in the distributed setting, ability to handle heavy-tailed data, outliers, and missing observations. Research that will be performed by the Principal Investigator (PI) in the course of this project focuses on two important problems faced by contemporary statistical science: scalability and robustness. The goal of the project is to advance our understanding of statistical techniques that involve (a) high-dimension covariance matrix estimation, and (b) distributed statistical estimation protocols. Obtained results will be of interest to scientists working on theory as well as applications.One part of this project aims at answering open questions related to high-dimensional covariance matrix estimation for the heavy-tailed distributions. Such distributions serve as a viable model for data corrupted with outliers, an almost inevitable scenario in applications. Covariance matrix is one of the most fundamental objects in high-dimensional data analysis: many important statistical tools, such as Principal Component Analysis (PCA) and regression analysis, involve covariance estimation as a crucial step. For instance, PCA has striking connections to nonlinear dimension reduction and manifold learning techniques, genetics, computational biology, among many others. However, the assumptions underlying the theoretical analysis of most existing estimators, such as various modifications of the sample covariance matrix, are often restrictive and do not hold for real-world scenarios. Using tools from the random matrix theory, the PI will develop a new class of robust estimators that are numerically tractable, show good practical performance and enjoy strong theoretical guarantees under much weaker conditions than currently available alternatives. Specifically, the goal of the project is to design estimators that admit tight concentration around the unknown "true" covariance matrix under weak assumptions on the underlying distribution, such as existence of moments of only low order. Another part of this project is devoted to novel algorithms for scalable estimation that can take advantage of the "divide and conquer" approach. Divide and conquer paradigm assumes that data is stored and analyzed in a distributed way by a cluster consisting of several machines: each of the machines in a cluster works on its own sub-sample while communication among different machines is limited, and final results are obtained by piecing the outcomes of these distributed computations together. The PI will develop a class of new divide and conquer strategies supported by strong theoretical evidence. The project will investigate connections between the distributed estimation strategies and robustness of resulting algorithms -- an important characteristic of large distributed systems.
现代数据丰富环境中的主要挑战需要新的统计算法,这些算法在现实场景和模型假设下取得成功,例如分布式环境中的估计,处理重尾数据,离群值和缺失观测的能力。主要研究者(PI)将在本项目过程中进行的研究集中在当代统计科学面临的两个重要问题:可扩展性和鲁棒性。该项目的目标是提高我们对统计技术的理解,包括(a)高维协方差矩阵估计,和(B)分布式统计估计协议。所得结果将对从事理论研究和应用研究的科学家们产生兴趣。本项目的一部分旨在回答与重尾分布的高维协方差矩阵估计相关的开放性问题。这样的分布作为一个可行的模型,数据损坏与离群值,在应用程序中几乎不可避免的情况。协方差矩阵是高维数据分析中最基本的对象之一,许多重要的统计工具,如主成分分析(PCA)和回归分析,都涉及协方差估计作为一个关键步骤。例如,PCA与非线性降维和流形学习技术、遗传学、计算生物学等有着惊人的联系。然而,大多数现有估计量的理论分析所依据的假设,如样本协方差矩阵的各种修改,往往是限制性的,并不适用于现实世界的情况。使用随机矩阵理论的工具,PI将开发一类新的鲁棒估计量,这些估计量在数值上易于处理,具有良好的实际性能,并且在比目前可用的替代方案弱得多的条件下具有强有力的理论保证。具体来说,该项目的目标是设计估计,承认周围的未知的“真正的”协方差矩阵的弱假设下的基础分布,如存在的时刻,只有低阶的紧浓度。 这个项目的另一部分是致力于新的算法,可扩展的估计,可以利用“分而治之”的方法。分而治之范式假设数据由多台机器组成的集群以分布式方式存储和分析:集群中的每台机器都在自己的子样本上工作,而不同机器之间的通信是有限的,最终结果是通过将这些分布式计算的结果拼凑在一起来获得的。PI将开发一类新的分而治之的战略,由强有力的理论证据支持。该项目将研究分布式估计策略和由此产生的算法的鲁棒性之间的联系-大型分布式系统的一个重要特征。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Excess risk bounds in robust empirical risk minimization
  • DOI:
    10.1093/imaiai/iaab004
  • 发表时间:
    2019-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker;Timothée Mathieu
  • 通讯作者:
    Stanislav Minsker;Timothée Mathieu
Distributed Statistical Estimation and Rates of Convergence in Normal Approximation
  • DOI:
    10.1214/19-ejs1647
  • 发表时间:
    2017-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker;Nate Strawn
  • 通讯作者:
    Stanislav Minsker;Nate Strawn
Estimation of the covariance structure of heavy-tailed distributions
  • DOI:
  • 发表时间:
    2017-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaohan Wei;Stanislav Minsker
  • 通讯作者:
    Xiaohan Wei;Stanislav Minsker
User-Friendly Covariance Estimation for Heavy-Tailed Distributions: A Survey and Recent Results
用户友好的重尾分布协方差估计:调查和最新结果
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    5.7
  • 作者:
    Minsker, Stanislav;Ke, Yuan;Ren, Zhao;Sun, Qiang;Zhou, Wen-Xin
  • 通讯作者:
    Zhou, Wen-Xin
Uniform bounds for robust mean estimators
  • DOI:
  • 发表时间:
    2018-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Stanislav Minsker其他文献

On Some Extensions of Bernstein's Inequality for Self-adjoint Operators
  • DOI:
    10.1016/j.spl.2017.03.020
  • 发表时间:
    2011-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker
Plug-in Approach to Active Learning
主动学习的插件方法
  • DOI:
    10.5555/2503308.2188388
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker
$L_1$-Penalization in Functional Linear Regression with Subgaussian Design
$L_1$-亚高斯设计函数线性回归中的惩罚
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    V. Koltchinskii;Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker
Geometric median and robust estimation in Banach spaces
  • DOI:
    10.3150/14-bej645
  • 发表时间:
    2013-08
  • 期刊:
  • 影响因子:
    1.5
  • 作者:
    Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker
Non-asymptotic bounds for prediction problems and density estimation
预测问题和密度估计的非渐近界限
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stanislav Minsker
  • 通讯作者:
    Stanislav Minsker

Stanislav Minsker的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Stanislav Minsker', 18)}}的其他基金

CAREER: Robust and Efficient Algorithms for Statistical Estimation and Inference
职业:用于统计估计和推理的稳健且高效的算法
  • 批准号:
    2045068
  • 财政年份:
    2021
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
CIF: Small: Towards Robust Statistical Learning: Theory and Algorithms
CIF:小:迈向稳健的统计学习:理论和算法
  • 批准号:
    1908905
  • 财政年份:
    2019
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant

相似国自然基金

鄂西北地区连翘野生抚育GAP种植关键技术研究及质量可追溯系统的构建
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Rap1GAP/SULT2B1 轴调控 T 细胞功能耗竭参 与梁状亚型肝癌耐药机制研究
  • 批准号:
    TGY24H160040
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
乙肝病毒核心蛋白通过抑制Rab-GAP诱导肝细胞损伤的分子机制研究
  • 批准号:
    82372233
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PKC调控GAP-43参与A型肉毒毒素治疗后神经肌肉接头重建机制研究
  • 批准号:
    82372563
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
超快热刺激下GAP/CL-20推进剂瞬态响应演变规律与机理研究
  • 批准号:
    52306161
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
血浆中突触相关蛋白GAP-43异常升高在阿尔茨海默病中的相关机制及作用研究
  • 批准号:
    82301380
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
RAP1GAP调控SREBP1促进肝细胞癌进展的分子机制及小分子抑制剂的应用研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
基于电化学剥离的三维GaP 纳米孔阵列膜构建新型光电化学全分解水体系
  • 批准号:
    21ZR1434900
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
局部紧群的Gap研究和群拓扑的构造
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
单晶Al2O3/GAP共晶陶瓷中低能GAP共格晶界的引入及其对力学性能影响机制
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

Bridging the gap between Key-Evolving Signatures and Their Applications
弥合密钥演化签名及其应用之间的差距
  • 批准号:
    DP240100017
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Discovery Projects
Bridging the gap between environment and patient; investigating the risk and transmission of antifungal resistance in Aspergillus fumigatus
弥合环境与患者之间的差距;
  • 批准号:
    MR/Y034465/1
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Research Grant
Collaborative Research: Bridging the scale gap between local and regional methane and carbon dioxide isotopic fluxes in the Arctic
合作研究:缩小北极当地和区域甲烷和二氧化碳同位素通量之间的规模差距
  • 批准号:
    2427291
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
Bridging the gap between rockfall theory and engineering practice
弥合落石理论与工程实践之间的差距
  • 批准号:
    IE230100410
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Early Career Industry Fellowships
eMB: Bridging the Gap Between Agent Based Models of Complex Biological Phenomena and Real-World Data Using Surrogate Models
eMB:使用代理模型弥合基于代理的复杂生物现象模型与真实世界数据之间的差距
  • 批准号:
    2324818
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
EAR-PF: Quantifying evaporation in Mono Basin: Bridging the gap between hydrologic modeling and paleoclimate records using triple oxygen and clumped isotope geochemistry
EAR-PF:量化莫诺盆地的蒸发:利用三重氧和聚集同位素地球化学弥合水文模型和古气候记录之间的差距
  • 批准号:
    2204433
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Fellowship Award
CIVIC-FA Track B: Bridging the Gap between Essential Emergency Resources and Services and the Deaf and Hard of Hearing Community in Monroe County NY: A Geospatial-Visual Approach
CIVIC-FA 轨道 B:弥合基本应急资源和服务与纽约州门罗县聋哑和听力障碍社区之间的差距:地理空间视觉方法
  • 批准号:
    2322255
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Kent, are you ready for your close-up? Bridging the gap between filming and destination promotion through technological solutions
肯特,你准备好特写了吗?
  • 批准号:
    10068416
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Collaborative R&D
Bridging the gap between theory and experiment in paramagnetic NMR analysis
弥合顺磁 NMR 分析理论与实验之间的差距
  • 批准号:
    EP/W022028/1
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Research Grant
Integrating Qualified Exercise Professionals into Health Service Delivery: Bridging the Gap between Exercise and Health Professionals and Primary Health Care to community physical activity
将合格的运动专业人员纳入健康服务提供:弥合运动和健康专业人员以及初级卫生保健与社区体育活动之间的差距
  • 批准号:
    480780
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Miscellaneous Programs
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了