Penalty, non-penalty shrinkage and ensemble methods for low and high dimensional data

低维和高维数据的惩罚、非惩罚收缩和集成方法

基本信息

  • 批准号:
    RGPIN-2019-04101
  • 负责人:
  • 金额:
    $ 1.17万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

This proposal is an initiative to i) provide non-penalty, penalty, and post penalty shrinkage methods and ii) combine models to enable a more robust prediction for low and high dimensional data. These data arise in various fields of sciences including genomics and health sciences. A statistical model is affected by problems associated with improved estimation of parameters when the datasets contain information on many predictors, some of which are not actively associated with the response or not of primary interest to the researcher. The pretest and non-penalty shrinkage methods (P-NPS) consider such inactive predictors as auxiliary information and incorporate them into the estimation procedure to improve the classical estimator of the regression parameters. In low dimensional data, my plan is to work on the P-NPS for joint modeling (JM) of longitudinal and survival data. I then plan to extend the work by simply choosing different longitudinal and survival models in a JM setting. The application of JM has a long history of being used in cancer clinical trials. I also have a plan to develop the P-NPS in generalized partially linear models for independent and longitudinal data as these models allow modeling the predictors nonparametrically along with the linear part. We define high dimensional data (HDD) when the number of predictors is larger than the sample size. The analysis of HDD is an important feature in a host of research areas such as social media, artificial intelligence, MRI and biomedical research. Most of the existing methods for dealing with HDD begin with model selection for further investigation. Penalty methods are unstable unless very stringent conditions are imposed. I consider the post penalty shrinkage strategies for generalized linear models (GLMs) to combat some of the issues inherited from penalty methods. These strategies will improve the prediction errors based on the selected submodels. I also propose to focus on investigating ensemble methods for GLMs to analyze HDD. These are very powerful techniques for improving the accuracy of predictions. I will then calculate aggregated predictions from the models based on the ensemble methods and compare them with the predictions from the model based on the existing penalty methods in the literature. Ensemble methods work well in various applications like image recognition, medicine, network security, and others. This proposal emphasizes that statisticians play an important role in solving problems in the analysis of non-normal (e.g., binary or count), longitudinal and survival data. It will also provide opportunities for training highly qualified personnel at all levels. This training has three components: methodology, computation, and analysis of real life data. Outcomes of this proposal are expected to aid stakeholders in health care services, and in other areas of applications where such data arise, in making proper decisions based on correct statistical inferences.
该提案是一项倡议,i)提供非惩罚、惩罚和惩罚后收缩方法,以及ii)联合收割机模型,以实现对低维和高维数据的更鲁棒预测。这些数据出现在包括基因组学和健康科学在内的各个科学领域。 当数据集包含许多预测因子的信息时,统计模型会受到与改进参数估计相关的问题的影响,其中一些预测因子与研究人员的响应无关或不是主要兴趣。预检验和非惩罚收缩方法(P-STIM)将这些非活性预测因子作为辅助信息,并将其纳入估计过程,以改进回归参数的经典估计。在低维数据中,我的计划是研究纵向和生存数据的联合建模(JM)的P-STIM。然后,我计划通过在JM环境中简单地选择不同的纵向和生存模型来扩展工作。JM在癌症临床试验中的应用历史悠久。我也有一个计划,以发展的P-S在广义部分线性模型的独立和纵向的数据,因为这些模型允许建模的预测非参数沿着与线性部分。我们定义高维数据(HDD)时,预测的数量大于样本大小。HDD的分析是许多研究领域的重要特征,如社交媒体,人工智能,MRI和生物医学研究。大多数现有的方法来处理硬盘开始与模型选择进一步的调查。惩罚方法是不稳定的,除非施加非常严格的条件。我考虑了广义线性模型(GLM)的后惩罚收缩策略,以解决从惩罚方法继承的一些问题。这些策略将改善基于所选子模型的预测误差。 我还建议集中研究GLM的集成方法来分析HDD。这些都是提高预测准确性的非常强大的技术。然后,我将根据集合方法计算模型的聚合预测,并将其与文献中基于现有惩罚方法的模型的预测进行比较。包围盒方法在各种应用中工作良好,如图像识别、医学、网络安全等。这一建议强调了统计学家在解决非正态分析问题中的重要作用(例如,二进制或计数)、纵向和存活数据。它还将为培训各级高素质人员提供机会。这种培训有三个组成部分:方法,计算和分析真实的生活数据。这一建议的成果预计将帮助利益相关者在医疗保健服务,并在其他领域的应用程序中出现这样的数据,在正确的统计推断的基础上作出适当的决定。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hossain, Md其他文献

Revised estimates of influenza-associated excess mortality, United States, 1995 through 2005
  • DOI:
    10.1186/1742-7622-5-26
  • 发表时间:
    2008-12-30
  • 期刊:
  • 影响因子:
    2.3
  • 作者:
    Foppa, Ivo;Hossain, Md
  • 通讯作者:
    Hossain, Md

Hossain, Md的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hossain, Md', 18)}}的其他基金

Penalty, non-penalty shrinkage and ensemble methods for low and high dimensional data
低维和高维数据的惩罚、非惩罚收缩和集成方法
  • 批准号:
    RGPIN-2019-04101
  • 财政年份:
    2021
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Penalty, non-penalty shrinkage and ensemble methods for low and high dimensional data
低维和高维数据的惩罚、非惩罚收缩和集成方法
  • 批准号:
    RGPIN-2019-04101
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Penalty, non-penalty shrinkage and ensemble methods for low and high dimensional data
低维和高维数据的惩罚、非惩罚收缩和集成方法
  • 批准号:
    RGPIN-2019-04101
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

面向非平稳演化抑郁状态的fMRI数据深度时频注意力因子化分析
  • 批准号:
    JCZRLH202500995
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
新能源电池低剂量高分辨X射线检测方法研究
  • 批准号:
    JCZRLH202500818
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
非酿酒酵母与酿酒酵母在共培养体系中的互作机理研究
  • 批准号:
    JCZRLH202500868
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
一般n维非齐次标量守恒律方程光滑解的表示及其爆破机制和非自相似解的研究
  • 批准号:
    JCZRQN202500890
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
动态复杂环境下的实时三维场景重建与非合作目标跟踪
  • 批准号:
    JCZRQN202500376
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多源数据融合的内外激励耦合下电驱动系统非平稳非高斯服役载荷谱高保
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
隧道纵坡诱发气流下车载锂电池非稳态燃烧行为与烟气蔓延特征
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
磁驱微混合器均质混合的磁流耦合机理与非均匀磁编码成形研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
具有非局部效应的脉冲扩散系统的动力学研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
金属玻璃中非晶多形态转变的本质及其对弛豫和性能的调控机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

Cosmological hydrodynamical simulations with calibrated non-universal initial mass functions
使用校准的非通用初始质量函数进行宇宙流体动力学模拟
  • 批准号:
    2903298
  • 财政年份:
    2027
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Studentship
非侵襲型BMIの高精度化に向けた自発脳活動キャンセリング技術の開発
开发自发脑活动取消技术,提高无创BMI准确度
  • 批准号:
    24K15691
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
COPDと肺気腫の非侵襲的在宅呼吸計測技術に関する研究
COPD及肺气肿无创家庭呼吸测量技术研究
  • 批准号:
    24K15849
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
「生きづらさ」を抱える妊産婦に対するnon-stigmatizing approachの開発
为正在经历“生活困难”的孕妇制定一种非侮辱性的方法
  • 批准号:
    24K14025
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
利き手と非利き手の機能分析ー眼球運動と筆圧値からの比較
惯用手和非惯用手的功能分析——眼球运动和笔压值的比较
  • 批准号:
    24K14252
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
幾何学的深層学習による非線形力学系のグレーボックスモデル化技術の創出
使用几何深度学习创建非线性动力系统灰盒建模技术
  • 批准号:
    24K15105
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
映像による血管調節機能の非接触計測と心血管調節モデルを仮定した自律神経機能評価
使用视频非接触式测量血管调节功能和假设心血管调节模型的自主神经功能评估
  • 批准号:
    24K15137
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
非典型相互作用を記述する3次元関数の算出とin silico SBDD/FBDD技術への応用
描述非典型相互作用的三维函数的计算及其在计算机SBDD/FBDD技术中的应用
  • 批准号:
    24K15167
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日仏メディアにおいてファッションを通して構築される非/規範的ジェンダー表象
日本和法国媒体通过时尚构建的非规范性别表征
  • 批准号:
    24K15565
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
非認知能力に対する運動・スポーツの関連メカニズムの解明:前向きコホート研究
阐明运动和运动对非认知能力的相关机制:一项前瞻性队列研究
  • 批准号:
    24K14604
  • 财政年份:
    2024
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了