CAREER: High Dimensional Variable Selection and Risk Properties

职业:高维变量选择和风险属性

基本信息

  • 批准号:
    0955316
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-01 至 2015-08-31
  • 项目状态:
    已结题

项目摘要

High dimensional variable selection plays a pivotal role in contemporary statistical modeling, learning and scientific discoveries. Long-standing theoretical questions in the literature include how high dimensionality regularization methods with general penalties can handle, what the role of penalty functions is, and how to characterize the optimality of variable selection procedures. The investigator proposes to study four interrelated research topics. First, the investigator studies penalized likelihood methods with general penalties, which are widely applied for simultaneously selecting important variables and estimating their effects in high dimensional statistical inference, where the dimensionality can be much larger than sample size. Second, various contexts of high dimensional variable selection beyond penalized likelihood methods including penalized empirical risk and hunting for interactions are investigated. Third, the investigator proposes new principles for model selection when models are possibly misspecified and studies the robustness of various regularization methods for high dimensional variable selection under model misspecification. Fourth, the risk properties and optimality of various high dimensional regularization methods in the contexts of penalized least squares and penalized likelihood are further investigated.The analysis of vast data sets now commonly arises in diverse fields of sciences, engineering and humanities ranging from genomics and health sciences to economics, finance and machine learning. High dimensional data analysis poses numerous challenges to statistical theory, methods and implementations that are not present in smaller scale studies. A major goal of this proposal is to make theoretical and methodological contributions to the important and challenging topic of high dimensional variable selection and statistical inference. These new developments provide unified and systematic understandings of various regularization methods in high dimensions, and allow scientists to analyze high dimensional data with increased efficiency, expediency and interpretability. The proposed work is incorporated into new courses on the state-of-the-art high dimensional statistical learning, and will benefit the training and learning of undergraduates, graduate students, and underrepresented minorities. The proposed work on variable selection in high dimensions will not only help better identify factors that are important to, for example, public health and market risk, but also benefit a broad range of scientists and researchers in various fields.
高维变量选择在当代统计建模、学习和科学发现中起着关键作用。文献中长期存在的理论问题包括具有一般惩罚的高维正则化方法如何处理,惩罚函数的作用是什么,以及如何表征变量选择过程的最优性。研究者建议研究四个相互关联的研究课题。首先,研究者研究了具有一般惩罚的惩罚似然方法,该方法广泛应用于高维统计推断中同时选择重要变量并估计其影响,其中维数可能远远大于样本量。其次,研究了惩罚似然方法之外的高维变量选择的各种背景,包括惩罚经验风险和寻找相互作用。第三,提出了模型可能存在错定性时的模型选择新原则,并研究了各种正则化方法在模型错定性下高维变量选择的鲁棒性。第四,进一步研究了在惩罚最小二乘和惩罚似然环境下各种高维正则化方法的风险性质和最优性。现在,对大量数据集的分析通常出现在科学、工程和人文学科的各个领域,从基因组学和健康科学到经济学、金融学和机器学习。高维数据分析对统计理论、方法和实现提出了许多挑战,这些挑战在小规模研究中是不存在的。本提案的一个主要目标是对高维变量选择和统计推断这一重要而具有挑战性的课题做出理论和方法上的贡献。这些新的发展提供了对各种高维正则化方法的统一和系统的理解,并使科学家能够以更高的效率、方便性和可解释性分析高维数据。建议的工作被纳入最新的高维统计学习的新课程,并将有利于本科生,研究生和代表性不足的少数民族的培训和学习。关于高维变量选择的拟议工作不仅将有助于更好地确定对公共卫生和市场风险等重要因素,而且还将使各个领域的广泛科学家和研究人员受益。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jinchi Lv其他文献

Inference in weak factor models
弱因子模型中的推理
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yingying Fan;Jinchi Lv;Mahrad Sharifvaghefi;Yoshimasa Uematsu;Yoshimasa Uematsu;Yoshimasa Uematsu;植松良公;植松良公;植松良公;植松良公;Yoshimasa Uematsu
  • 通讯作者:
    Yoshimasa Uematsu
ST ] 1 1 M ay 2 01 6 Model selection principles in misspecified models †
ST ] 1 1 May 2 01 6 错误指定模型中的模型选择原则 †
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jinchi Lv
  • 通讯作者:
    Jinchi Lv
Asymptotic properties of high-dimensional random forests
高维随机森林的渐近性质
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Chien;Patrick Vossler;Yingying Fan;Jinchi Lv
  • 通讯作者:
    Jinchi Lv
Estimation of weak factor models
弱因子模型的估计
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yingying Fan;Jinchi Lv;Mahrad Sharifvaghefi;Yoshimasa Uematsu;Yoshimasa Uematsu;Yoshimasa Uematsu;植松良公;植松良公;植松良公;植松良公;Yoshimasa Uematsu;Yoshimasa Uematsu
  • 通讯作者:
    Yoshimasa Uematsu
Supplementary material to “Panning for gold: Model-X knock-offs for high-dimensional controlled variable selection”
“淘金:用于高维控制变量选择的 Model-X 仿制品”的补充材料
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Candès;Yingying Fan;Lucas Janson;Jinchi Lv
  • 通讯作者:
    Jinchi Lv

Jinchi Lv的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jinchi Lv', 18)}}的其他基金

Collaborative Research: New Theory and Methods for High-Dimensional Multi-Task and Transfer Learning Inference
合作研究:高维多任务和迁移学习推理的新理论和新方法
  • 批准号:
    2324490
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
High-Dimensional Interaction Detection and Nonparametric Inference
高维交互检测和非参数推理
  • 批准号:
    1953356
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Variable Selection in High Dimensional Feature Space with Applications to Covariance Matrix Estimation and Functional Data Analysis
高维特征空间中的变量选择及其在协方差矩阵估计和函数数据分析中的应用
  • 批准号:
    0806030
  • 财政年份:
    2008
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队

相似海外基金

Variable Selection and Prediction for High-Dimensional Genetic Data with Complex Structures
复杂结构高维遗传数据的变量选择与预测
  • 批准号:
    RGPIN-2020-05133
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Variable Selection and Prediction for High-Dimensional Genetic Data with Complex Structures
复杂结构高维遗传数据的变量选择与预测
  • 批准号:
    RGPIN-2020-05133
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Variable Selection and Prediction for High-Dimensional Genetic Data with Complex Structures
复杂结构高维遗传数据的变量选择与预测
  • 批准号:
    RGPIN-2020-05133
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
Bayesian variable selection in high-dimensional latent variable models
高维潜变量模型中的贝叶斯变量选择
  • 批准号:
    2467837
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Studentship
Variable Selection and Prediction for High-Dimensional Genetic Data with Complex Structures
复杂结构高维遗传数据的变量选择与预测
  • 批准号:
    DGECR-2020-00344
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Launch Supplement
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    DGECR-2019-00345
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Launch Supplement
Non-Convex Landscapes and High-Dimensional Latent Variable Models
非凸景观和高维潜变量模型
  • 批准号:
    1916198
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了