Collaborative Research: Consistent Risk Estimation under High-Dimensional Asymptotics

合作研究:高维渐近下的一致风险估计

基本信息

  • 批准号:
    1810880
  • 负责人:
  • 金额:
    $ 7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-01 至 2021-07-31
  • 项目状态:
    已结题

项目摘要

Learning from large datasets has been the cornerstone of modern innovations and discoveries in science, medicine, and technology. Fast prediction of unseen events is a canonical goal in statistical learning. A classic approach to this end is leave-one-out cross-validation, a time-consuming routine of leaving a datum out, fitting the model on the rest, and testing it on the left out datum, repeatedly. The recent emergence of massive data has exacerbated the computational infeasibility of such approaches. Moreover, in many recent instances, the number of features per observation can be extremely large, adding another challenging facet to the fast estimation of prediction error. To overcome these problems a new set of scalable and consistent risk estimators will be developed in this project. The importance of risk estimation has motivated this project of different schemes, such as cross-validation, Stein's unbiased risk estimation (SURE), Generalized cross-validation, Akaike Information Criterion (AIC), and Bootstrap. The emergence of high-dimensional datasets has challenged most classical approaches to risk estimation. For instance, the large discrepancy between in-sample and out-of-sample prediction error, in applications involving predictions based on previously unseen features, makes it hard to rely on popular estimators, such as SURE or AIC, in high-dimensional regimes where the number of predictors is smaller than or at the same order as the number of observations. On the other hand, the information value of a datum in these regimes (as opposed to the information value of a datum in low-dimensional settings) casts doubt on the reliability of other techniques, such as 5-fold cross-validation. The project offers a novel theoretical framework to find the middle ground between scalability and reliability, and specifically, to obtain theoretically consistent and computationally efficient risk-estimation schemes under high-dimensional settings. Since risk estimation is at the core of areas including but not limited to machine learning, signal processing, medical imaging, neuroscience, and social and environmental sciences, any success in this project will lead to reliable and immediate scientific discoveries and better learning systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
从大型数据集中学习一直是科学、医学和技术领域现代创新和发现的基石。快速预测未知事件是统计学习的一个典型目标。一个经典的方法是留一交叉验证,这是一个耗时的例程,需要将一个数据排除在外,在其余数据上拟合模型,并在排除的数据上重复测试。最近大量数据的出现加剧了这种方法的计算不可行性。此外,在最近的许多情况下,每次观察的特征数量可能非常大,这给预测误差的快速估计增加了另一个挑战性方面。为了克服这些问题,一套新的可扩展的和一致的风险估计将在这个项目中开发。风险估计的重要性促使该项目采用了不同的方案,例如交叉验证、Stein的无偏风险估计(SURE)、广义交叉验证、Akaike信息准则(AIC)和Bootstrap。高维数据集的出现对大多数经典的风险估计方法提出了挑战。例如,在涉及基于先前未见过的特征的预测的应用中,样本内和样本外预测误差之间的巨大差异使得在预测因子的数量小于观测值的数量或与观测值的数量处于相同数量级的高维区域中难以依赖流行的估计器,例如SURE或AIC。另一方面,在这些制度中的数据的信息值(相对于低维设置中的数据的信息值)对其他技术的可靠性表示怀疑,例如5折交叉验证。该项目提供了一个新的理论框架,以找到可扩展性和可靠性之间的中间地带,特别是在高维设置下获得理论上一致和计算效率高的风险估计方案。由于风险估计是机器学习、信号处理、医学成像、神经科学以及社会和环境科学等领域的核心,该项目的任何成功都将导致可靠和即时的科学发现和更好的学习系统。该奖项反映了NSF的法定使命,并通过利用基金会的智力价值和更广泛的影响进行评估,被认为值得支持审查标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A scalable estimate of the out-of-sample prediction error via approximate leave-one-out cross-validation
Error bounds in estimating the out-of-sample prediction error using leave-one-out cross validation in high-dimensions
使用高维留一交叉验证估计样本外预测误差的误差范围
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kamiar Rahnama Rad其他文献

Robust and scalable Bayesian analysis of spatial neural tuning function data
空间神经调谐函数数据的稳健且可扩展的贝叶斯分析
  • DOI:
    10.1214/16-aoas996
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kamiar Rahnama Rad;Timothy A. Machado;L. Paninski
  • 通讯作者:
    L. Paninski
Robust particle filters via sequential pairwise reparameterized Gibbs sampling
通过顺序成对重新参数化吉布斯采样实现鲁棒粒子过滤器
Sharp Sufficient Conditions on Exact Sparsity Pattern Recovery
  • DOI:
  • 发表时间:
    2009-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kamiar Rahnama Rad
  • 通讯作者:
    Kamiar Rahnama Rad
Efficient, adaptive estimation of two-dimensional firing rate surfaces via Gaussian process methods
通过高斯过程方法对二维发射率表面进行高效、自适应估计
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kamiar Rahnama Rad;L. Paninski
  • 通讯作者:
    L. Paninski
Consistent Risk Estimation in High-Dimensional Linear Regression
高维线性回归中的一致风险估计
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ji Xu;A. Maleki;Kamiar Rahnama Rad
  • 通讯作者:
    Kamiar Rahnama Rad

Kamiar Rahnama Rad的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CNS Core: Small: Resource-efficient, Strongly Consistent Replication for the Cloud
合作研究:CNS 核心:小型:资源高效、强一致性的云复制
  • 批准号:
    2149389
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: Advancing the Data-to-Distribution Pipeline for Scalable Data-Consistent Inversion to Quantify Uncertainties in Coastal Hazards
合作研究:推进数据到分发管道,实现可扩展的数据一致反演,以量化沿海灾害的不确定性
  • 批准号:
    2208460
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: Consistent Treatment of Boundaries and Interfaces in Metamaterials
合作研究:超材料边界和界面的一致处理
  • 批准号:
    2219203
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: Consistent Treatment of Boundaries and Interfaces in Metamaterials
合作研究:超材料边界和界面的一致处理
  • 批准号:
    2219087
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Resource-efficient, Strongly Consistent Replication for the Cloud
合作研究:CNS 核心:小型:资源高效、强一致性的云复制
  • 批准号:
    2149443
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: Advancing the Data-to-Distribution Pipeline for Scalable Data-Consistent Inversion to Quantify Uncertainties in Coastal Hazards
合作研究:推进数据到分发管道,实现可扩展的数据一致反演,以量化沿海灾害的不确定性
  • 批准号:
    2208461
  • 财政年份:
    2022
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
CNS Core: Medium: Collaborative Research: Persistent memory objects for consistent sharing in Non-Volatile Main Memories
CNS 核心:中:协作研究:用于非易失性主存储器中一致共享的持久内存对象
  • 批准号:
    1900758
  • 财政年份:
    2019
  • 资助金额:
    $ 7万
  • 项目类别:
    Continuing Grant
CNS Core: Medium: Collaborative Research: Persistent memory objects for consistent sharing in Non-Volatile Main Memories
CNS 核心:中:协作研究:用于非易失性主存储器中一致共享的持久内存对象
  • 批准号:
    1900724
  • 财政年份:
    2019
  • 资助金额:
    $ 7万
  • 项目类别:
    Continuing Grant
GOALI/Collaborative Research: Consistent Nursing Home Staff Planning under Heterogeneous Service Demand
GOALI/合作研究:异构服务需求下一致的疗养院人员规划
  • 批准号:
    1825725
  • 财政年份:
    2018
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
Collaborative Research: Consistent Risk Estimation under High-Dimensional Asymptotics
合作研究:高维渐近下的一致风险估计
  • 批准号:
    1810888
  • 财政年份:
    2018
  • 资助金额:
    $ 7万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了