Statistical analysis for categorical data subject to misclassification errors

对存在错误分类错误的分类数据进行统计分析

基本信息

  • 批准号:
    RGPIN-2021-03535
  • 负责人:
  • 金额:
    $ 1.53万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2021
  • 资助国家:
    加拿大
  • 起止时间:
    2021-01-01 至 2022-12-31
  • 项目状态:
    已结题

项目摘要

The proposal aims to tackle some emerging issues in analyzing categorical data that are not perfectly assessed. The primary goal is to (1) enrich the toolbox of statistical methodologies on categorical data subject to misclassification errors and (2) provide valid and insightful guidelines for applied practitioners. Categorical data subject to misclassification errors has been commonly encountered in many applied fields such as health science, psychology, and genetic studies. For instance, smoking status is measured by a self-report questionnaire. Due to the fear of stigmatization, participants may not always report their true smoking behaviour. It has been long recognized that simply ignoring such errors can lead to biased inference that may severely distort the truth. Most of the existing literature focus on either only misclassified covariates (usually binary) or only misclassified response variables (usually binary). Rather limited work has been done for dealing with simultaneous misclassification of response variables and covariates, which has been becoming increasingly common in real world. For example, studies that share the same sources of information (e.g., self-report questionnaire) to assess both the response variable (e.g. disease status) and the covariate (e.g., smoking status) tend to have correlated misclassification errors. This proposal aims to tackle the challenges arising from the real applications in three different yet interconnected directions: (1) developing models that can accommodate correlated misclassification of the response variable and the covariate; (2) assessing consequences of using incorrect misclassification models; (3) developing test procedures for diagnosing the validity of assumptions about the misclassification structure.
该提案旨在解决分析未得到完美评估的分类数据时出现的一些问题。其主要目标是(1)丰富分类数据的统计方法工具箱,(2)为应用实践者提供有效和有见地的指导方针。在健康科学、心理学和遗传学等许多应用领域中,经常会遇到分类错误的问题。例如,吸烟状况通过自我报告问卷来衡量。由于害怕被污名化,参与者可能并不总是报告他们真正的吸烟行为。人们早就认识到,简单地忽略这些错误可能会导致有偏见的推断,可能会严重扭曲真相。大多数现有文献只关注错误分类的协变量(通常是二进制)或仅错误分类的响应变量(通常是二进制)。在真实的世界中,响应变量和协变量的同时误分类问题越来越普遍,但对于这一问题的研究却相当有限。例如,共享相同信息来源的研究(例如,自我报告问卷)以评估响应变量(例如疾病状态)和协变量(例如,吸烟状况)往往具有相关的误分类错误。该提案旨在从三个不同但相互关联的方向解决真实的应用所带来的挑战:(1)开发能够适应响应变量和协变量的相关误分类的模型;(2)评估使用不正确的误分类模型的后果;(3)开发用于诊断关于误分类结构的假设的有效性的测试程序。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Liu, Juxin其他文献

Disentangling legacy effects from environmental filters of postfire assembly of boreal tree assemblages
  • DOI:
    10.1890/14-2302.1
  • 发表时间:
    2015-11-01
  • 期刊:
  • 影响因子:
    4.8
  • 作者:
    Brown, Carissa D.;Liu, Juxin;Johnstone, Jill F.
  • 通讯作者:
    Johnstone, Jill F.
A goodness-of-fit test for zero-inflated Poisson mixed effects models in tree abundance studies
  • DOI:
    10.1016/j.csda.2019.106887
  • 发表时间:
    2020-04-01
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Liu, Juxin;Ma, Yanyuan;Johnstone, Jill
  • 通讯作者:
    Johnstone, Jill
Discordance in Hormone Receptor Status Among Primary, Metastatic, and Second Primary Breast Cancers: Biological Difference or Misclassification?
  • DOI:
    10.1634/theoncologist.2013-0427
  • 发表时间:
    2014-06-01
  • 期刊:
  • 影响因子:
    5.8
  • 作者:
    Sighoko, Dominique;Liu, Juxin;Huo, Dezheng
  • 通讯作者:
    Huo, Dezheng
Bayesian analysis of a matched case-control study with expert prior information on both the misclassification of exposure and the exposure-disease association
  • DOI:
    10.1002/sim.3694
  • 发表时间:
    2009-11-30
  • 期刊:
  • 影响因子:
    2
  • 作者:
    Liu, Juxin;Gustafson, Paul;Burstyn, Igor
  • 通讯作者:
    Burstyn, Igor

Liu, Juxin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Liu, Juxin', 18)}}的其他基金

Statistical analysis for categorical data subject to misclassification errors
对存在错误分类错误的分类数据进行统计分析
  • 批准号:
    RGPIN-2021-03535
  • 财政年份:
    2022
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2020
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2019
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2018
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2017
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2016
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
statistical methods for some emerging issues in modeling latent variables
潜在变量建模中一些新出现问题的统计方法
  • 批准号:
    RGPIN-2015-04746
  • 财政年份:
    2015
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
Statistical analysis of interactions and errors in variables
变量交互作用和误差的统计分析
  • 批准号:
    371504-2010
  • 财政年份:
    2014
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
Pre-consultation decision support systems driven by patient questions
由患者问题驱动的预咨询决策支持系统
  • 批准号:
    448150-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Engage Grants Program
Statistical analysis of interactions and errors in variables
变量交互作用和误差的统计分析
  • 批准号:
    371504-2010
  • 财政年份:
    2013
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Intelligent Patent Analysis for Optimized Technology Stack Selection:Blockchain BusinessRegistry Case Demonstration
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
利用全基因组关联分析和QTL-seq发掘花生白绢病抗性分子标记
  • 批准号:
    31971981
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
基于SERS纳米标签和光子晶体的单细胞Western Blot定量分析技术研究
  • 批准号:
    31900571
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
利用多个实验群体解析猪保幼带形成及其自然消褪的遗传机制
  • 批准号:
    31972542
  • 批准年份:
    2019
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
基于Meta-analysis的新疆棉花灌水增产模型研究
  • 批准号:
    41601604
  • 批准年份:
    2016
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究
  • 批准号:
    61502059
  • 批准年份:
    2015
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
多目标诉求下我国交通节能减排市场导向的政策组合选择研究
  • 批准号:
    71473155
  • 批准年份:
    2014
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
大规模微阵列数据组的meta-analysis方法研究
  • 批准号:
    31100958
  • 批准年份:
    2011
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于物质流分析的中国石油资源流动过程及碳效应研究
  • 批准号:
    41101116
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Statistical analysis for categorical data subject to misclassification errors
对存在错误分类错误的分类数据进行统计分析
  • 批准号:
    RGPIN-2021-03535
  • 财政年份:
    2022
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Discovery Grants Program - Individual
Statistical Analysis of Categorical Time Series through Sparse Markov Models
通过稀疏马尔可夫模型对分类时间序列进行统计分析
  • 批准号:
    1811933
  • 财政年份:
    2018
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Standard Grant
Development of new statistical models in categorical data analysis
分类数据分析中新统计模型的开发
  • 批准号:
    26730017
  • 财政年份:
    2014
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Computer-intensive statistical methods in multivariate analysis
多变量分析中的计算机密集型统计方法
  • 批准号:
    05680258
  • 财政年份:
    1993
  • 资助金额:
    $ 1.53万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
STATISTICAL INFERENCE FOR SPARSE CATEGORICAL DATA
稀疏分类数据的统计推断
  • 批准号:
    2182207
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
STATISTICAL INFERENCE FOR SPARSE CATEGORICAL DATA
稀疏分类数据的统计推断
  • 批准号:
    2415141
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
STATISTICAL INFERENCE FOR SPARSE CATEGORICAL DATA
稀疏分类数据的统计推断
  • 批准号:
    2910076
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
STATISTICAL INFERENCE FOR SPARSE CATEGORICAL DATA
稀疏分类数据的统计推断
  • 批准号:
    2182208
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
STATISTICAL INFERENCE FOR SPARSE CATEGORICAL DATA
稀疏分类数据的统计推断
  • 批准号:
    2630934
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
STATISTICAL Inference for Sparse Categorical Data
稀疏分类数据的统计推断
  • 批准号:
    6636004
  • 财政年份:
    1990
  • 资助金额:
    $ 1.53万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了