Bayesian Variable Selection in Generalized Linear Models with Missing Varibles

缺失变量的广义线性模型中的贝叶斯变量选择

基本信息

  • 批准号:
    8194802
  • 负责人:
  • 金额:
    $ 19.27万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-08-11 至 2014-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): The applicant seeks to address the problem of missing values A major challenge for biomedical research comes from the problems of missing values, which may be caused by subjective (e.g., nonresponse and dropout) and technical reasons (e.g., censoring over/below quantization level). Generalized linear models (GLMs) and Generalized Linear Mixed Models (GLMMs) are popularly applied in biomedical data analysis where a fundamental task is to identify a subset of independent variables (e.g., genetic, proteomic, behavioral, or environmental factors) to interpret or predict a dependent variable (e.g., therapeutic effectiveness and safety). Given an incomplete data set, practitioners may needlessly resort to the strategy of case-deletion where individuals are excluded from consideration if they miss any of the variables targeted for analysis. This method would not only sacrifice useful information, but also give rise to biased estimates because it requires strong assumptions to accept the missingness mechanisms. A more satisfactory solution for missing data problems involves multiple imputation, where several imputations are created for the same set of missing values. Across multiply imputed data sets, however, traditional variable selection methods (based on significance tests or likelihood criteria) often result in models with different selected predictors, thus presenting a problem of combining the models to make final inferences. In this R01 proposal, we aim to develop alternative strategies of variable selection for GLMs with missing values by drawing on a Bayesian framework. One approach called "impute, then select" (ITS) involves initially performing multiple imputation and then applying Bayesian variable selection to the multiply imputed data sets. The second strategy - "simultaneously impute and select" (SIAS) - conducts Bayesian variable selection and missing data imputation simultaneously within one Markov Chain Monte Carlo (MCMC) process. ITS and SIAS offer two generic frameworks within which various Bayesian variable selection algorithms and missing data imputation algorithms can be implemented. The strategies will be extended to handle complex data sets such as those with multi-level design structures and/or large number of variables. The strategies will be developed, evaluated, and implemented into an R library for normal, binomial/multinomial, and Poisson regression models with mixed categorical and continuous explanatory variables. Simulated and practical data sets from studies on childhood autism and drug dependence will be used to address the effectiveness and flexibility of the proposed strategies. PUBLIC HEALTH RELEVANCE: Missing data is the normal circumstance when developing large data sets. This issue comes to the forefront when using large data sets to develop personalized and individualized care. To avoid this loss of data and provide better predictions of risk and benefit, imputation-based Bayesian variable selection strategy provides a powerful analytical tool. The availability of our new method and software package will greatly enhance the capacity and quality of medical research and healthcare delivery
描述(由申请人提供):申请人试图解决缺失价值的问题,生物医学研究的主要挑战来自缺失值的问题,这些问题可能是由主观(例如,无响应和辍学)和技术原因(例如,审查超过/低于量化量)引起的。广义线性模型(GLM)和广义线性混合模型(GLMM)通常应用于生物医学数据分析中,其中基本任务是识别自变量(例如,遗传,蛋白质组织,行为或环境因素)的子集以解释或预测依赖性变量(例如,治疗性的有效性和安全性和安全性)。给定一个不完整的数据集,从业人员可能不必要地诉诸案例删除策略,如果个人错过了针对分析的任何变量,则将其排除在外。该方法不仅会牺牲有用的信息,而且会产生偏见的估计,因为它需要强有力的假设来接受丢失机制。对于缺少数据问题的一个更令人满意的解决方案涉及多个插补,其中为同一一组缺失值创建了几个插图。但是,在乘以估算的数据集中,传统的变量选择方法(基于显着性测试或似然标准)通常会导致具有不同选择预测变量的模型,从而提出了将模型结合起来以进行最终推论的问题。 在此R01提案中,我们旨在通过绘制贝叶斯框架来制定具有缺失值的可变选择的替代策略。一种称为“插入的方法,然后选择”(ITS)涉及最初执行多个插补,然后将贝叶斯变量选择应用于乘积估算的数据集。第二种策略 - “同时算上并选择”(SIAS) - 在一个马尔可夫链蒙特卡洛(MCMC)过程中同时进行贝叶斯变量选择和缺失数据。它的SIA和SIA提供了两个通用框架,可以在其中实现各种贝叶斯变量选择算法和缺少数据插入算法的框架。这些策略将扩展到处理复杂的数据集,例如具有多层设计结构和/或大量变量的数据集。这些策略将被开发,评估和实施到R库中,以使用具有混合分类和连续解释变量的正常,二项式/多项式和泊松回归模型。关于儿童自闭症和药物依赖研究的研究和实用数据集将用于解决拟议策略的有效性和灵活性。 公共卫生相关性:丢失数据是开发大型数据集时的正常情况。当使用大型数据集开发个性化和个性化的护理时,这个问题就位于最前沿。为了避免这种数据丢失并为风险和利益提供更好的预测,基于插补的贝叶斯变量选择策略提供了强大的分析工具。我们的新方法和软件包的可用性将大大提高医学研究和医疗保健服务的能力和质量

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

XIAOWEI YANG其他文献

XIAOWEI YANG的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('XIAOWEI YANG', 18)}}的其他基金

Bayesian Variable Selection in Generalized Linear Models with Missing Varibles
缺失变量的广义线性模型中的贝叶斯变量选择
  • 批准号:
    8471550
  • 财政年份:
    2011
  • 资助金额:
    $ 19.27万
  • 项目类别:
Bayesian Variable Selection in Generalized Linear Models with Missing Varibles
缺失变量的广义线性模型中的贝叶斯变量选择
  • 批准号:
    8317303
  • 财政年份:
    2011
  • 资助金额:
    $ 19.27万
  • 项目类别:
Bayesian Variable Selection in Generalized Linear Models with Missing Varibles
缺失变量的广义线性模型中的贝叶斯变量选择
  • 批准号:
    8543193
  • 财政年份:
    2011
  • 资助金额:
    $ 19.27万
  • 项目类别:
iPhone-based Real-time Data Solution for Drug Abuse and Other Medical Research
基于 iPhone 的药物滥用和其他医学研究实时数据解决方案
  • 批准号:
    7672825
  • 财政年份:
    2009
  • 资助金额:
    $ 19.27万
  • 项目类别:
Transition Model for Incomplete Longitudinal Binary Data
不完整纵向二进制数据的转换模型
  • 批准号:
    6676189
  • 财政年份:
    2003
  • 资助金额:
    $ 19.27万
  • 项目类别:
DEVELOPMENT OF AN AUTOMATED NEURAL SPIKE DISCRIMINATOR
自动神经尖峰鉴别器的开发
  • 批准号:
    3504570
  • 财政年份:
    1991
  • 资助金额:
    $ 19.27万
  • 项目类别:

相似国自然基金

分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
  • 批准号:
    12371308
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
资源受限下集成学习算法设计与硬件实现研究
  • 批准号:
    62372198
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于物理信息神经网络的电磁场快速算法研究
  • 批准号:
    52377005
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
考虑桩-土-水耦合效应的饱和砂土变形与流动问题的SPH模型与高效算法研究
  • 批准号:
    12302257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向高维不平衡数据的分类集成算法研究
  • 批准号:
    62306119
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Brain Digital Slide Archive: An Open Source Platform for data sharing and analysis of digital neuropathology
Brain Digital Slide Archive:数字神经病理学数据共享和分析的开源平台
  • 批准号:
    10735564
  • 财政年份:
    2023
  • 资助金额:
    $ 19.27万
  • 项目类别:
Computer-Aided Triage of Body CT Scans with Deep Learning
利用深度学习对身体 CT 扫描进行计算机辅助分类
  • 批准号:
    10585553
  • 财政年份:
    2023
  • 资助金额:
    $ 19.27万
  • 项目类别:
Point-of-care diagnostic test for T. cruzi (Chagas) infection
克氏锥虫(恰加斯)感染的即时诊断测试
  • 批准号:
    10603665
  • 财政年份:
    2023
  • 资助金额:
    $ 19.27万
  • 项目类别:
i-AKC: Integrated AIRR Knowledge Commons
i-AKC:综合 AIRR 知识共享
  • 批准号:
    10712558
  • 财政年份:
    2023
  • 资助金额:
    $ 19.27万
  • 项目类别:
A visualization interface for BRAIN single cell data, integrating transcriptomics, epigenomics and spatial assays
BRAIN 单细胞数据的可视化界面,集成转录组学、表观基因组学和空间分析
  • 批准号:
    10643313
  • 财政年份:
    2023
  • 资助金额:
    $ 19.27万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了