基于再生核希尔伯特空间的变量选择及其相关问题研究

批准号:
11901375
项目类别:
青年科学基金项目
资助金额:
25.0 万元
负责人:
贺莘
依托单位:
学科分类:
A0402.统计推断与统计计算
结题年份:
2022
批准年份:
2019
项目状态:
已结题
项目参与者:
--
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
随着高性能计算与海量数据存储技术的发展,超高维数据越来越多的出现在社会生活以及科学研究等诸多领域,引起了研究者的广泛关注。通过变量选择,可以抓取超高维数据中对统计分析真实有用的变量,克服经典统计学方法所遇到的困难,并且可以显著地提高统计估计与预测的精确性,为更深入的统计分析奠定了基础。本项目拟利用再生核希尔伯特空间中函数所特有的性质,如导数的可再生性等,基于再生核希尔伯特空间的岭回归工具,提出一类具有良好数据与模型适应性、计算高效迅速以及有理论保证的变量选择方法;以平方损失函数为例,借助泛函分析中的算子工具给出更精确的理论结果,并以线性模型等为特例深入研究其性质;将该类方法扩展到目前热门的变量交互效应的选择中。申请者扎实的理论基础,丰富的研究积累以及前期较多的探索性工作,为本项目的顺利完成奠定坚实的基础,其最终研究成果将进一步丰富变量选择方法,为有效处理超高维数据提供一个新颖的思路。
英文摘要
With the development of high-performance computing and big data storage technology, ultra-high dimensional data analysis has attracted tremendous interests from both researchers and practitioners, because of its appearance in many real applications, including social and economic sciences. Variable selection aims to correctly identify the truly informative variables in the ultra-high dimensional data, overcome the difficulties encountered in classical statistical methods, and significantly improve the estimation and prediction accuracy. Thus, the objective of this research proposal is to provide a novel variable selection method by taking full use of the nice properties in reproducing kernel Hilbert space (RKHS), such as derivative reproducing property, representer theorem, as well as the kernel ridge regression in RKHS. Its key advantage is that it assumes no explicit model assumption, admits general predictor effects, allows for scalable computation, and attains desirable asymptotic theoretical results. Tighter theoretical results are provided for squared loss function with some extra operators in functional analysis, and a linear case is studied as a special case of our method to provide some better understanding both methodologically and theoretically. Furthermore, we extend the proposed method to interaction selection, which has attracted tremendous interest in recent years. The applicant’s solid theoretical foundation,rich research experience and preliminary exploratory research will lead the project into the right direction for its successful completion, which will make some substantial contributions to the research on variable selection, and provide a novel idea for efficiently solving the ultra-high dimensional data.
随着高性能计算与海量数据存储技术的发展,超高维数据越来越多的出现在社会生活以及 科学研究等诸多领域,引起了研究者的广泛关注。本项目拟利用再生核希尔伯特空间中函数所特 有的性质,如导数的可再生性等,基于再生核希尔伯特空间的岭回归工具,提出一类具有良好 数据与模型适应性、计算高效迅速以及有理论保证的变量选择方法;以平方损失函数为例,借 助泛函分析中的算子工具给出更精确的理论结果,并以线性模型等为特例深入研究其性质;将 该类方法扩展到目前热门的变量交互效应的选择,网络数据分析以及有向无环图的还原估计中。申请者扎实的理论基础,丰富的研究积累 以及前期较多的探索性工作,为本项目的顺利完成奠定坚实的基础,其最终研究成果将进一步丰富相关领域的研究。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:doi:https://doi.org/10.5705/ss.202019.0401
发表时间:2021
期刊:Statistica Sinica
影响因子:--
作者:Xin He;Junhui Wang;Shaogao Lv
通讯作者:Shaogao Lv
Learning linear non-Gaussian directed acyclic graph with diverging number of nodes
学习具有不同节点数的线性非高斯有向无环图
DOI:--
发表时间:2021-11
期刊:Journal of Machine Learning Research
影响因子:6
作者:Zhao Ruixuan;HE Xin;Wang Junhui
通讯作者:Wang Junhui
DOI:10.5705/ss.202018.0086
发表时间:2020-10-01
期刊:STATISTICA SINICA
影响因子:1.4
作者:He, Xin;Lv, Shaogao;Wang, Junhui
通讯作者:Wang, Junhui
Learning sparse conditional distribution: An efficient kernel-based approach
学习稀疏条件分布:一种高效的基于内核的方法
DOI:10.1214/21-ejs1824
发表时间:2021-01
期刊:Electronic Journal of Statistics
影响因子:1.1
作者:Fang Chen;Xin He;Junhui Wang
通讯作者:Junhui Wang
DOI:https://doi.org/10.1214/21-EJS1824
发表时间:2021
期刊:Electronic Journal of Statistics
影响因子:1.1
作者:Fang Chen;Xin He;Junhui Wang
通讯作者:Junhui Wang
基于核的非参数估计方法在若干热点复杂结构数据中的研究与应用
- 批准号:24ZR1421400
- 项目类别:省市级项目
- 资助金额:0.0万元
- 批准年份:2024
- 负责人:贺莘
- 依托单位:
国内基金
海外基金
