Resampling-based comparison studies of prediction methods with emphasis on high-dimensional biological data

基于重采样的预测方法比较研究,重点关注高维生物数据

基本信息

项目摘要

Resampling-based comparison studies of prediction methods using real data sets are routinely conducted in computational research, including, for instance, that for biostatistics, bioinformatics, or machine learning. For example, supervised classification methods may be compared with respect to their cross-validation error on, say, five exemplary real data sets. However, many methodological issues related to such comparison studies, and resampling-based methods in general, remain unanswered. This project deals with such issues with emphasis on applications to high-dimensional biological data, among others. In the first part of the project we address the design of comparison studies from a statistical testing perspective by drawing parallels between comparison studies in computational sciences (in which the performances of the methods are compared in real data sets) and clinical trials (in which therapy effects are compared in patients). In light of this metaphor we develop methods to address issues such as the choice of the resampling procedure with respect to its variability and the relationship between the performance of a method and the characteristics of the datasets, with emphasis on statistical inference and power. We extend this statistical framework to issues other than prediction models. The second part deals with scientific practice and the interpretation of literature in the field of computational science with focus on prediction methods while borrowing concepts from biomedical/clinical research. More precisely, we extend concepts such as meta-analysis, inclusion criteria for patients in clinical studies, and the degree of freedom of the researcher (related to multiple testing issues and fishing for significance) to the world of computational research. The goal of this part is to suggest first concepts and to investigate their feasibility. In the third part we develop methods related to parameter tuning for prediction methods, which is often performed using resampling methods in practice. We propose methods to measure the impact of tuning parameters on the performance of a method, we systematically assess and compare various resampling-based procedures for tuning, and we develop alternatives to resampling.
基于重采样的预测方法的比较研究,使用真实的数据集通常在计算研究中进行,包括,例如,生物统计学,生物信息学,或机器学习。例如,监督分类方法可以相对于它们在例如五个示例性真实的数据集上的交叉验证误差进行比较。然而,与这种比较研究有关的许多方法学问题,以及一般的基于重采样的方法,仍然没有答案。该项目处理这些问题,重点是高维生物数据的应用等。在该项目的第一部分,我们从统计检验的角度处理比较研究的设计,通过绘制计算科学(在真实的数据集中比较方法的性能)和临床试验(在患者中比较治疗效果)之间的比较研究之间的相似之处。根据这个比喻,我们开发的方法来解决的问题,如选择的restaurant程序相对于其可变性和方法的性能和数据集的特性之间的关系,重点是统计推断和权力。我们将这个统计框架扩展到预测模型以外的问题。第二部分涉及计算科学领域的科学实践和文献解释,重点是预测方法,同时从生物医学/临床研究中借用概念。更确切地说,我们扩展的概念,如荟萃分析,纳入标准的患者在临床研究中,研究人员的自由度(涉及多个测试问题和捕鱼的意义)的计算研究的世界。这一部分的目的是提出第一个概念,并调查其可行性。在第三部分中,我们开发了与预测方法的参数整定相关的方法,这在实践中通常使用reservation方法进行。我们提出的方法来衡量调整参数的方法的性能的影响,我们系统地评估和比较各种重采样为基础的程序调整,我们开发的替代方案,重新采样。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professorin Dr. Anne-Laure Boulesteix其他文献

Professorin Dr. Anne-Laure Boulesteix的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professorin Dr. Anne-Laure Boulesteix', 18)}}的其他基金

Datenaufbereitung bei der Validierung von biomedizinischen Prädiktionsmodellen
生物医学预测模型验证中的数据准备
  • 批准号:
    192522475
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Increasing clinical usefulness of gene signature prediction rules through simplification and validation
通过简化和验证提高基因特征预测规则的临床实用性
  • 批准号:
    208375936
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Towards neutral comparison studies in methodological biostatistics research
生物统计学方法研究中的中立比较研究
  • 批准号:
    497316619
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Empirical studies on the researcher degrees of freedom in biomedical data analysis
生物医学数据分析中研究者自由度的实证研究
  • 批准号:
    424874387
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
  • 批准号:
    W2433169
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
  • 批准号:
    52301178
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
NbZrTi基多主元合金中化学不均匀性对辐照行为的影响研究
  • 批准号:
    12305290
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
眼表菌群影响糖尿病患者干眼发生的人群流行病学研究
  • 批准号:
    82371110
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
镍基UNS N10003合金辐照位错环演化机制及其对力学性能的影响研究
  • 批准号:
    12375280
  • 批准年份:
    2023
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
CuAgSe基热电材料的结构特性与构效关系研究
  • 批准号:
    22375214
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
基于大数据定量研究城市化对中国季节性流感传播的影响及其机理
  • 批准号:
    82003509
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

A Paradigm Shift in Health Behavior Change: Understanding When and How Social Comparison Supports Healthy Behavior
健康行为改变的范式转变:了解社会比较何时以及如何支持健康行为
  • 批准号:
    10685733
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Adapting Treatment Delivery to Improve Retention in Evidence-Based PTSD Treatment
调整治疗方式以提高循证 PTSD 治疗的保留率
  • 批准号:
    10539602
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Cue Reactivity Modulation in MSM with Methamphetamine Use Disorder
甲基苯丙胺使用障碍 MSM 的提示反应性调节
  • 批准号:
    10663559
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
LINK-IT: Leveraging vIdeos and commuNity health worKers to address socIal determinants of health in immigranTs
LINK-IT:利用视频和社区卫生工作者解决移民健康的社会决定因素
  • 批准号:
    10736695
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
ECHO Renewal for the INSPIRE Study Cohort
INSPIRE 研究队列的 ECHO 更新
  • 批准号:
    10745075
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Opening Dental and Oral Research Summers (DORS) to Scientific Careers throughout Oregon
向整个俄勒冈州的科学职业开放牙科和口腔研究暑期项目 (DORS)
  • 批准号:
    10598424
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
A pragmatic randomized trial to evaluate the effect of a peer-comparison feedback letter on antimicrobial use in hospital-based physicians
一项实用的随机试验,旨在评估同行比较反馈信对医院医生抗菌药物使用的影响
  • 批准号:
    483302
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
A pragmatic randomized trial to evaluate the effect of a peer-comparison feedback letter on antimicrobial use in hospital-based physicians
一项实用的随机试验,旨在评估同行比较反馈信对医院医生抗菌药物使用的影响
  • 批准号:
    490409
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Scaling Telehealth Models to Improve Co-morbid Diabetes and Hypertension in Immigrant Populations
扩大远程医疗模式以改善移民人群的糖尿病和高血压共病
  • 批准号:
    10680980
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
iKinnect Mobile Technology to Reduce Teen Substance Misuse and Health Disparities
iKinnect 移动技术可减少青少年药物滥用和健康差异
  • 批准号:
    10545162
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了