基于随机森林的高维生物医学数据因果推断方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    81872709
  • 项目类别:
    面上项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    H3011.流行病学方法与卫生统计
  • 结题年份:
    2020
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2020-12-31

项目摘要

It is one of the ultimate goals to identify the causality in philosophy, natural science, social science and medicine. Modern biomedical researches have generated big and confounded datasets. Thus the analysis on high dimensional biomedical data should focus on not only association, but also causality. The present research introduces the definitions of causal inference into a framework of random forests (RF). After adjusting for complex confounding effects, we will use the RF to estimate the causal effects and make the corresponding hypothesis testing. We will also study on how to construct the mediation network for multi-omics data. Based on the above methodological study, we aim to set up the steps and strategies for causal inference using machine learning-based methods. Extensive simulations and real world –omics or longitudinal datasets will be used to evaluate the performance of the proposed methods. The present study will provide the methodology, theoretical references, and software supports for the causal inference on complex datasets.
探讨事物之间的因果关系,一直是哲学、自然科学、社会科学、医学等几乎所有科学研究的最终目的之一。现代生物医学研究产生了大而混杂的数据,因而高维生物医学数据的分析,不能只求关联,不求因果。本研究在随机森林框架下,引入因果推断的概念,在控制了复杂混杂后,实现因果分析中的效应估计和假设检验;探讨多组学数据高维中介网络的构建方法。通过以上的方法学研究,实现基于机器学习的高维生物医学数据的因果推断。本研究采用理论推导建立相关方法,利用计算机模拟试验评价所提出方法的性质,并结合真实数据考察相应方法的实际表现和应用条件。课题的顺利实施将为复杂数据的因果推断分析提供理论依据、方法参考和软件支持,具有重大的科学意义和实用价值。

结项摘要

探索因果关系是生物医学研究的最终目的之一。传统因果推断多基于回归模型,需要较多假设。本研究将随机森林等机器学习方法引入因果推断领域,开展了方法学与应用研究,取得了一系列成果。研究主要围绕效应估计和网络构建两个角度展开。在效应估计方面:申请人首先提出了srRF和倾向性加权随机森林法,模拟研究表明,这两种方法较传统随机森林能更好地控制混杂因素;课题组进一步比较了基于反事实框架下的因果森林、因果MARS等方法用于估计个体处理效应时的表现,并针对随机对照研究中的个体处理效应,提出了一套处理效应异质性,并优化最佳治疗措施选择的策略,用于SPRINT和ACCORD两个大型心血管病研究中的个体处理效应估计及亚组识别;提出了针对纵向队列数据,通过历史随机森林进行特征筛选,结合联合建模进行个体精准预测的思路,用于COVID-19和H7N9病人预后预测,准确率令人满意;在解决混杂因素后,利用因果森林进行中介效应估计,可以便捷地处理复杂混杂和多维中介变量问题,进行直接效应、间接效应等因果推断中重要统计量的估计。在网络构建方面:提出了交互随机森林法,其对于一阶交互作用的识别好于目前最佳的迭代随机森林法;比较了经典随机森林以及两种改进随机森林iRafNet和dynGENIE3从基因表达数据中推断调控网络的能力;基于代谢组学数据,建立交互作用网络;提出了随机森林用于调控网络识别的分析策略。本研究也基于方法学研究成果,开发了多个免费软件,提供了公共网址,供研究者进行使用。本研究的顺利完成,促进了机器学习与因果推断的有机整合,取得的成果将有力推进健康医疗大数据领域分析方法和应用研究的发展。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
临床试验数据人工审核清单的SAS宏实现
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中国临床药理学与治疗学
  • 影响因子:
    --
  • 作者:
    吴彩萍;赵杨
  • 通讯作者:
    赵杨
随机森林在基因调控网络推断上的比较与应用
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中国卫生统计
  • 影响因子:
    --
  • 作者:
    张铭智;尤东方;何文静;张汝阳;陈峰;胡志斌;赵杨
  • 通讯作者:
    赵杨
Identifying and exploiting gene-pathway interactions from RNA-seq data for binary phenotype
从 RNA-seq 数据中识别和利用基因通路相互作用以获得二元表型
  • DOI:
    10.1186/s12863-019-0739-7
  • 发表时间:
    2019-03
  • 期刊:
    BMC Genetics
  • 影响因子:
    2.9
  • 作者:
    Shao Fang;Wang Yaqi;Zhao Yang;Yang Sheng
  • 通讯作者:
    Yang Sheng
Identification of genetic features associated with fine particulate matter (PM2.5) modulated DNA damage using improved random forest analysis
使用改进的随机森林分析识别与细颗粒物 (PM2.5) 调节的 DNA 损伤相关的遗传特征
  • DOI:
    10.1016/j.gene.2020.144570
  • 发表时间:
    2020
  • 期刊:
    Gene
  • 影响因子:
    3.5
  • 作者:
    Dongfang You;Na Qing;Mingzhi Zhang;Juncheng Dai;Mulong Du;Yongyue Wei;RuyangZhang;Zhibin Hu;David C. Christiani;Yang Zhao;Feng Chen
  • 通讯作者:
    Feng Chen
利用因果森林估计异质性人群下个体的处理效应
  • DOI:
    10.3760/cma.j.issn.0254-6450.2019.06.020
  • 发表时间:
    2019
  • 期刊:
    中华流行病学杂志
  • 影响因子:
    --
  • 作者:
    何文静;尤东方;张汝阳;于浩;陈峰;胡志斌;赵杨
  • 通讯作者:
    赵杨

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

倾向性评分方法及其规范化应用的统计学共识
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    中国卫生统计
  • 影响因子:
    --
  • 作者:
    黄丽红;王永吉;王素珍;赵杨;王彤
  • 通讯作者:
    王彤
高变异药物平均生物等效性试验中两种重复交叉设计的样本量估计
  • DOI:
    10.12092/j.issn.1009-2501.2019.02.008
  • 发表时间:
    2019
  • 期刊:
    中国临床药理学与治疗学
  • 影响因子:
    --
  • 作者:
    王傲;蔡晶晶;柏建岭;刘月;于宣宣;陈峰;赵杨;于浩
  • 通讯作者:
    于浩
生物统计学本科专业人才培养方案的设置与思考
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    中国卫生统计
  • 影响因子:
    --
  • 作者:
    赵杨;于浩;胡志斌;陈峰
  • 通讯作者:
    陈峰
中国粮食稳产增产的路径选择
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    学习与探索
  • 影响因子:
    --
  • 作者:
    赵杨
  • 通讯作者:
    赵杨
基于GPU加速的潮流模型及其在岛群二维水动力数值模拟中的应用
  • DOI:
    10.13634/j.cnki.mes.2017.05.022
  • 发表时间:
    2017
  • 期刊:
    海洋环境科学
  • 影响因子:
    --
  • 作者:
    赵旭东;赵杨;孙家文;于永海;孙昭晨;梁书秀
  • 通讯作者:
    梁书秀

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

赵杨的其他基金

环境混合污染物的健康效应统计分析方法研究
  • 批准号:
    82373690
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于真实世界数据的个体处理效应估计方法研究
  • 批准号:
    82173620
  • 批准年份:
    2021
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
基于真实世界数据的个体处理效应估计方法研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
整合常见和罕见变异进行肺癌风险预测的统计方法研究
  • 批准号:
    81373102
  • 批准年份:
    2013
  • 资助金额:
    70.0 万元
  • 项目类别:
    面上项目
基于基因表达数据的风险得分函数在肿瘤诊断和预后评价中的应用研究
  • 批准号:
    30901232
  • 批准年份:
    2009
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码