New algorithms for consistent model selection beyond linear models

用于超越线性模型的一致模型选择的新算法

基本信息

项目摘要

Statistical model building is an important part of scientific discovery. In the big data era, high dimensional data arise frequently. Model selection in the presence of high dimensional features in the framework of linear models, generalized linear models, and models with censored data has been a very active area of research in recent years. The PI aims to develop new algorithms for model selection, within a Bayesian computational framework, that are scalable for high dimensional problems. The PI motivates the proposed research through collaborations with scientists in atmospheric sciences, genetics, and kinesiology, and aims to develop methodologies that are broadly applicable in statistical modeling and data analysis. Much of the recent work has focused on shrinkage through penalization or regularization. Bayesian computational methods, when interpreted broadly, play a valuable role in statistics, including model selection and estimation, but face important hurdles in high dimensional statistics, both in theoretical intricacy and in computational scalability. The PI aims to develop a theoretical framework to demonstrate model selection consistency from the frequentist perspective, which offers interesting insights into why Bayesian model selection methods can provide an asymptotic approximation to the L0 penalty. An important part of the proposed work is the development of a modified Gibbs sampler in the selection of sparse models that is much more scalable than standard MCMC algorithms in the presence of high dimensional variables. The Bayesian methods are especially useful in problems with non-convex objective functions, where Bayesian computation methods can be more robust in performance than direct optimization. A primary application of such a problem considered in the project is quantile regression for censored data. In addition to model selection, the PI proposes a new estimation method for censored quantile regression that promises to be computationally and statistically efficient. Equally importantly, the new method adapts easily to general forms of censoring that other estimation methods have found difficult to handle. The PI will continue integrating research with education by working with PhD students and by providing research experiences for undergraduate students. The research output will be properly disseminated through conferences and workshops and through publication in widely read journals in statistical science.
统计模型的建立是科学发现的重要组成部分。在大数据时代,高维数据频繁出现。 在线性模型、广义线性模型和删失数据模型的框架下,高维特征下的模型选择是近年来一个非常活跃的研究领域。 PI的目的是开发新的算法模型选择,贝叶斯计算框架内,是可扩展的高维问题。 PI通过与大气科学,遗传学和运动学科学家的合作来激励拟议的研究,旨在开发广泛适用于统计建模和数据分析的方法。 最近的大部分工作都集中在通过惩罚或正规化收缩。 贝叶斯计算方法,当广义地解释时,在统计学中起着有价值的作用,包括模型选择和估计,但在高维统计中面临着重要的障碍,无论是在理论上的复杂性和计算的可扩展性。 PI旨在开发一个理论框架,从频率论的角度来证明模型选择的一致性,这为贝叶斯模型选择方法为什么可以提供L0惩罚的渐近近似提供了有趣的见解。所提出的工作的一个重要组成部分是一个修改后的吉布斯采样器的稀疏模型的选择,这是更可扩展的比标准的MCMC算法在高维变量的存在下的发展。贝叶斯方法在具有非凸目标函数的问题中特别有用,其中贝叶斯计算方法在性能上比直接优化更鲁棒。在这个项目中考虑的这样一个问题的主要应用是分位数回归删失数据。除了模型选择之外,PI还提出了一种新的估计方法,用于删失分位数回归,该方法有望在计算和统计上有效。同样重要的是,新方法很容易适应一般形式的审查,其他估计方法已经发现难以处理。PI将通过与博士生合作并为本科生提供研究经验,继续将研究与教育相结合。研究成果将通过会议和讲习班以及在广泛阅读的统计科学期刊上发表的方式适当传播。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xuming He其他文献

Semi-Supervised Domain-Adaptive Pulmonary Artery Segmentation via Uncertainty Guidance and Shape Strengthening
通过不确定性指导和形状强化进行半监督域自适应肺动脉分割
Optical ReLU-like activation function based on a semiconductor laser with optical injection.
基于光注入半导体激光器的类光学 ReLU 激活函数。
  • DOI:
    10.1364/ol.511113
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Guanting Liu;Yiwei Shen;Ruiqian Li;Jingyi Yu;Xuming He;Chengyuan Wang
  • 通讯作者:
    Chengyuan Wang
On marginal estimation in a semiparametric model for longitudinal data with time-independent covariates
具有时间无关协变量的纵向数据半参数模型中的边际估计
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xuming He;Mi
  • 通讯作者:
    Mi
PENALIZED LIKELIHOOD FOR LOGISTIC-NORMAL MIXTURE MODELS WITH UNEQUAL VARIANCES
  • DOI:
    doi: https://doi.org/10.5705/ss.202015.0371
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
  • 作者:
    Juan Shen;Yingchuan Wang;Xuming He
  • 通讯作者:
    Xuming He
LAW OF THE ITERATED LOGARITHM AND INVARIANCE PRINCIPLE FOR M-ESTIMATORS
M-估计量的迭代对数定律和不变性原理
  • DOI:
    10.1090/s0002-9939-1995-1231036-7
  • 发表时间:
    1995
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xuming He;G. Wang
  • 通讯作者:
    G. Wang

Xuming He的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xuming He', 18)}}的其他基金

Conference: Workshop on Translational Research on Data Heterogeneity
会议:数据异构性转化研究研讨会
  • 批准号:
    2406154
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Covariate-adjusted Expected Shortfall under Data Heterogeneity
数据异质性下的协变量调整预期缺口
  • 批准号:
    2310464
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Covariate-adjusted Expected Shortfall under Data Heterogeneity
数据异质性下的协变量调整预期缺口
  • 批准号:
    2345035
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Towards Efficient Bias Correction in Data Snooping
实现数据窥探中的有效偏差校正
  • 批准号:
    1914496
  • 财政年份:
    2019
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Statistics at a Crossroads: Challenges and Opportunities in the Data Science Era
十字路口的统计学:数据科学时代的挑战与机遇
  • 批准号:
    1840278
  • 财政年份:
    2018
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
New Directions in Quantile-based Modeling and Analysis
基于分位数的建模和分析的新方向
  • 批准号:
    1307566
  • 财政年份:
    2013
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Efficient Modeling in Quantile Regression
分位数回归的高效建模
  • 批准号:
    1237234
  • 财政年份:
    2011
  • 资助金额:
    $ 30万
  • 项目类别:
    Continuing Grant
Efficient Modeling in Quantile Regression
分位数回归的高效建模
  • 批准号:
    1007396
  • 财政年份:
    2010
  • 资助金额:
    $ 30万
  • 项目类别:
    Continuing Grant
A Virtual Center to Promote Collaboration between US- and China-based Researchers in Statistical Science
促进中美统计科学研究人员合作的虚拟中心
  • 批准号:
    0630950
  • 财政年份:
    2006
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Inferential Methods for Quantile Regression
分位数回归的推理方法
  • 批准号:
    0604229
  • 财政年份:
    2006
  • 资助金额:
    $ 30万
  • 项目类别:
    Continuing Grant

相似国自然基金

固定参数可解算法在平面图问题的应用以及和整数线性规划的关系
  • 批准号:
    60973026
  • 批准年份:
    2009
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Scaling up the Next-Generation Communication Systems: from physically-consistent modelling to low complexity DSP algorithms to hardware implementation
扩展下一代通信系统:从物理一致的建模到低复杂度 DSP 算法再到硬件实现
  • 批准号:
    570045-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 30万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Scalable tools for consistent identification of neuronal cell types in mouse and human
用于一致识别小鼠和人类神经元细胞类型的可扩展工具
  • 批准号:
    10365216
  • 财政年份:
    2021
  • 资助金额:
    $ 30万
  • 项目类别:
Individual flexibility, population equity: Development of decision support algorithms and guidelines to support clear and consistent levels of home and community care services in Ontario
个人灵活性、人口公平:开发决策支持算法和指南,以支持安大略省清晰一致的家庭和社区护理服务水平
  • 批准号:
    347943
  • 财政年份:
    2015
  • 资助金额:
    $ 30万
  • 项目类别:
    Studentship Programs
Consistent anatomy registration for lung cancer adaptive radiation therapy
肺癌适应性放射治疗的一致解剖配准
  • 批准号:
    8438590
  • 财政年份:
    2013
  • 资助金额:
    $ 30万
  • 项目类别:
Consistent anatomy registration for lung cancer adaptive radiation therapy
肺癌适应性放射治疗的一致解剖配准
  • 批准号:
    8609007
  • 财政年份:
    2013
  • 资助金额:
    $ 30万
  • 项目类别:
Consistent anatomy registration for lung cancer adaptive radiation therapy
肺癌适应性放射治疗的一致解剖配准
  • 批准号:
    9198529
  • 财政年份:
    2013
  • 资助金额:
    $ 30万
  • 项目类别:
Task Shifting Model of Depression Treatment to Unleash HIV Public Health Benefits
抑郁症治疗任务转移模式释放艾滋病毒公共卫生效益
  • 批准号:
    8658853
  • 财政年份:
    2012
  • 资助金额:
    $ 30万
  • 项目类别:
Task Shifting Model of Depression Treatment to Unleash HIV Public Health Benefits
抑郁症治疗任务转移模式释放艾滋病毒公共卫生效益
  • 批准号:
    8514732
  • 财政年份:
    2012
  • 资助金额:
    $ 30万
  • 项目类别:
Task Shifting Model of Depression Treatment to Unleash HIV Public Health Benefits
抑郁症治疗任务转移模式释放艾滋病毒公共卫生效益
  • 批准号:
    8294317
  • 财政年份:
    2012
  • 资助金额:
    $ 30万
  • 项目类别:
Consistent model selection in the p>>n setting
p>>n 设置中一致的模型选择
  • 批准号:
    8451848
  • 财政年份:
    2011
  • 资助金额:
    $ 30万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了