删失数据超高维共线性模型的变量选择
结题报告
批准号:
11726615
项目类别:
数学天元基金项目
资助金额:
20.0 万元
负责人:
唐年胜
依托单位:
学科分类:
A0403.贝叶斯统计与统计应用
结题年份:
2018
批准年份:
2017
项目状态:
已结题
项目参与者:
董莹
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
超高维数据的降维是当今统计学研究的前沿课题。本项目拟研究带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。尽管对删失数据的变量选择已有一些研究成果,但对于区间删失数据模型的变量选择的研究尚少,因此,为了避免超高维数据带来的共线性问题的困扰,本项目拟对带区间删失数据的广义线性模型提出推广的组合惩罚,构造新的惩罚似然函数,发展新的变量筛选方法。在超高维框架下发展新的变量筛选方法以实现充分降维,探索合适的算法,将理论成果应用于实际数据分析。其研究可以丰富惩罚类变量选择的方法体系,也为生存数据分析领域的应用提供理论基础。
英文摘要
Dimensionality reduction of high-dimensional data is a frontier topic nowadays. This project aims to solve the variable selection in ultra-high dimensional models with censored data, especially for the collinearity models. Although there was much literature about censored data, there was no systematic theoretical investigation of simultaneous variable selection and coefficients estimation in the continuous generalized linear model with current status data. The existence of high correlation among variables in high-dimensional data can cause a serious problem of collinearity, therefore the main focus of this study is to resolve this issue. We propose a new combined-penalization which mixed by a nonconcave penalized function and the ridge. Inspired by Sure Independence Screening(SIS) method, we explore the appropriate algorithm and explain the corresponding data in the reality. This research can enrich the variable selection method system of penalization, as well as provide theoretical basis for the application in the area of survival analysis.
超高维数据的降维是当今统计学研究的前沿课题。本项目研究了带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。由于在超高维的数据下,共线性问题更为普遍,对于相关度较高的一组协变量,变量选择的结果很可能只选择出一个变量。所以,超高维变量之间具有高度相关关系(即共线性关系)的变量选择问题是我们亟待解决的问题。本年度的研究内容可分为以下三部分:一、我们给出了超高维情况下广义线性模型的变量选择,应用SCAD-Ridge组合的惩罚,在一定的假设条件下,证明了该模型的估计所具有的理论性质,当调整参数满足适当的条件时,该方法能够一致地选出真实模型,模拟结果也表明了这一方法的结果具有优良的统计性质。二、以连续广义线性模型为主要研究对象,构造带有删失数据的惩罚似然目标函数,该部分模型已经构建,为得到适合删失数据下共线性问题的更有效的估计方法,接下来还需进一步证明估计的渐近性质以及研究其模拟结果,以确定提出方法的可行性。三、基于研究者的兴趣提出了一个新的混合模型,该模型欲解决金融、保险精算、生物医学等领域常遇到的混合总体的估计问题,探讨了该类混合总体的广义线性模型的M—估计。在合适的假设条件下,证明了提出模型的估计具有一致性和渐近正态性。同时,为了估计这个模型的有限样本性质,我们给出了该模型的数值模拟,这些模拟的结果说明了我们所提出的模型的合理性。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
SCAD-Ridge penalized likelihood estimators for ultra-high dimensional models
超高维模型的 SCAD-Ridge 惩罚似然估计器
DOI:10.15672/hjms.201612518375
发表时间:2016-05
期刊:Hacettepe Journal of Mathematics and Statistics
影响因子:0.8
作者:Ying Dong;Lixin Song;Muhammad Amin
通讯作者:Muhammad Amin
M-estimation of mixed-type generalized linear model
混合型广义线性模型的M估计
DOI:--
发表时间:2018
期刊:Probability and Mathematical Statistics
影响因子:--
作者:Ying Dong;Lixin Song;Mingqiu Wang;Muhammad Amin
通讯作者:Muhammad Amin
分布式张量回归的变分推断
  • 批准号:
    12271472
  • 项目类别:
    面上项目
  • 资助金额:
    46万元
  • 批准年份:
    2022
  • 负责人:
    唐年胜
  • 依托单位:
高维缺失数据半监督支持向量机研究
  • 批准号:
    12126362
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2021
  • 负责人:
    唐年胜
  • 依托单位:
数学学科2021-2035年中长期发展规划及“十四五”发展规划战略研究
  • 批准号:
    --
  • 项目类别:
    专项基金项目
  • 资助金额:
    10万元
  • 批准年份:
    2019
  • 负责人:
    唐年胜
  • 依托单位:
国际贝叶斯分析学会2020年世界大会
  • 批准号:
    --
  • 项目类别:
    --
  • 资助金额:
    20万元
  • 批准年份:
    2019
  • 负责人:
    唐年胜
  • 依托单位:
2018年统计学研究生暑期学校
  • 批准号:
    11826027
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    60.0万元
  • 批准年份:
    2018
  • 负责人:
    唐年胜
  • 依托单位:
2017年全国统计学研究生暑期学校
  • 批准号:
    11726024
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    60.0万元
  • 批准年份:
    2017
  • 负责人:
    唐年胜
  • 依托单位:
超高维数据统计推断
  • 批准号:
    11731011
  • 项目类别:
    重点项目
  • 资助金额:
    250.0万元
  • 批准年份:
    2017
  • 负责人:
    唐年胜
  • 依托单位:
2016年统计学研究生暑期学校
  • 批准号:
    11626020
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    68.0万元
  • 批准年份:
    2016
  • 负责人:
    唐年胜
  • 依托单位:
不可忽略缺失数据模型的统计推断方法研究
  • 批准号:
    11671349
  • 项目类别:
    面上项目
  • 资助金额:
    50.0万元
  • 批准年份:
    2016
  • 负责人:
    唐年胜
  • 依托单位:
2015年西部地区统计学青年教师暑期培训
  • 批准号:
    11526027
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    75.0万元
  • 批准年份:
    2015
  • 负责人:
    唐年胜
  • 依托单位:
国内基金
海外基金