数据缺失时高维数据降维分析的方法、理论与应用

批准号:
11171331
项目类别:
面上项目
资助金额:
40.0 万元
负责人:
王启华
依托单位:
学科分类:
A0403.贝叶斯统计与统计应用
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
丁晓波、段小刚、陈晓林、罗瑞苗、张庆昭、王璇、李永进
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
高维数据分析是当前统计研究的热点之一,特别是自从Li (1991,JASA)提出切片逆回归技术以来,许多降维方法被提出. 然而这些方法主要针对数据完全观察的情形。但实际中数据常常有缺失,而数据缺失时降维问题趋今研究较少,这方面值得特别的专门研究。本项目分别研究反映变量缺失或协变量缺失时降维方法与降维技术,在反映变量缺失时我们将首先发展融合-精练两步方法找到中心降维子空间,发展概率质量函数加权imputation方法估计所获得的中心降维子空间的基,并证明是根号n相合估计,将Zhu等(2009,Biometrika)中估计维数的方法推广到缺失数据情形;我们还将发展反映变量缺失时切片逆回归方法与极大化相关系数法;我们还通过求中心分位子空间获得中心子空间;研究反映变量缺失时降维技术在变量选择中的应用。此外,我们也研究协变量缺失时降维技术,在无须对倾向性得分函数作模型假设下发展降维技术。
英文摘要
缺失数据普遍发生在一些实际问题的研究中。本项目研究数据缺失时高维数据分析的方法、理论与应用。研究了协变量缺失时非参数降维问题,发展了两步方法,证明了降维方向估计有根号n相合性及维数估计的相合性,与已有工作本质区别在于本项研究无需假设任何模型;研究了反映变量缺失时降维技术在变量选择中的应用问题,基于SIR方法发展了不依赖模型假设的变量选择方法; 研究了异方差部分线性单指标模型的变量选择问题及估计的渐近有效性问题,我们发展了有效估计方程方法,该有效估计方程是使用部分线性单指标模型的有效得分函数并基于阈值估计方程得到的, 所定义的估计具有Oracle性质及渐近有效性;研究了部分线性乘积模型相对误差估计方法,证明了所定义的估计是相合的和渐近正态的,并在相对误差准则下研究了变量选择问题,证明了所发展的变量选择方法具有Oracle性质;基于复发事件数据发展了可加比率模型的变量选择问题,根据回归系数的估计定义了一个损失函数, 对该损失函数分别施加L_1及SCAD惩罚发展两种变量选择方法, 在适当条件下证明了两种方法均具有Oracle性质;在响应变量缺失时,考虑了由一广义估计方程所确定参数的估计问题,在倾向得分函数是参数模型假设下,我们使用加权广义矩方法定义了两种估计,其权是由经验似然方法获得,由于经验似然使用降维约束条件,因而该避免了已有的GMM估计方法的维数祸根问题,从而也解决了计算上的困难;在删失示性变量缺失时,研究了线性回归分析,定义了回归校准估计、插补估计、逆概率加权估计,证明了所定义的估计的渐近正态性;在响应变量缺失下研究了一扩展的单指标模型的估计问题,使用联合估计方程发展一种三步估计方法估计单指标参数向量及非参数函数,建立了估计的渐近理论。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
LOCAL LEAST ABSOLUTE RELATIVE ERROR ESTIMATING APPROACH FOR PARTIALLY LINEAR MULTIPLICATIVE MODEL
部分线性乘法模型的局部最小绝对相对误差估计方法
DOI:10.5705/ss.2012.133
发表时间:2013
期刊:Statistica Sinica
影响因子:1.4
作者:Zhang, Qingzhao;Wang, Qihua
通讯作者:Wang, Qihua
DOI:10.1007/s10463-014-0484-7
发表时间:2015-10
期刊:Annals of the Institute of Statistical Mathematics
影响因子:1
作者:Xuan Wang;Qihua Wang;Xiaocong Zhou
通讯作者:Xuan Wang;Qihua Wang;Xiaocong Zhou
DOI:10.1016/j.jmva.2012.02.013
发表时间:2012-08
期刊:J. Multivar. Anal.
影响因子:--
作者:Qihua Wang;Xingwei Tong;Liuquan Sun
通讯作者:Qihua Wang;Xingwei Tong;Liuquan Sun
DOI:10.1016/j.csda.2013.09.007
发表时间:2014-02
期刊:Computational Statistics & Data Analysis
影响因子:1.8
作者:Zhang Tao;Zhang Qingzhao;Wang Qihua
通讯作者:Wang Qihua
DOI:--
发表时间:2012
期刊:Journal of Statistical Planning and Inference
影响因子:0.9
作者:Zhang Tao;Wang Qihua
通讯作者:Wang Qihua
若干分布式非参数统计方法及其理论研究
- 批准号:12271510
- 项目类别:面上项目
- 资助金额:46万元
- 批准年份:2022
- 负责人:王启华
- 依托单位:
缺失数据分析中若干重要问题研究
- 批准号:11871460
- 项目类别:面上项目
- 资助金额:55.0万元
- 批准年份:2018
- 负责人:王启华
- 依托单位:
生物医学数据统计分析的方法、理论与应用
- 批准号:11331011
- 项目类别:重点项目
- 资助金额:240.0万元
- 批准年份:2013
- 负责人:王启华
- 依托单位:
协变量缺失时生存数据回归分析的方法、理论与应用
- 批准号:10671198
- 项目类别:面上项目
- 资助金额:21.0万元
- 批准年份:2006
- 负责人:王启华
- 依托单位:
核实数据帮助下测量误差回归模型的校准分析
- 批准号:10241001
- 项目类别:专项基金项目
- 资助金额:4.0万元
- 批准年份:2002
- 负责人:王启华
- 依托单位:
国内基金
海外基金
