Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets

可解释的机器学习识别阿尔茨海默病的治疗目标

基本信息

  • 批准号:
    10132962
  • 负责人:
  • 金额:
    $ 58.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-02-15 至 2023-12-21
  • 项目状态:
    已结题

项目摘要

Project Summary Alzheimer’s disease (AD) is an urgent national and international research priority. Amyloid plaques and neurofibrillary tangles are the hallmark of AD. Their building blocks are Amyloid-β (Aβ) and tau, respectively. At present, we lack an understanding of the set of genes that affect formation of plaques and tangles along with protective and pathological responses to these toxic peptides. Biologists are now gathering gene expression data and Aβ and tau measures from human brain tissues. The current approach attempts to find a set of features (here, gene expression levels) that best predict an outcome (Aβ or tau level). The identified features, biomarkers, can help determine the molecular basis for plaques and tangles. Unfortunately, false positive biomarkers are very common, as evidenced by low success rates of replication in independent data and low success reaching clinical practice (less than 1%). We seek to radically shift the current paradigm in biomarker discovery by resolving three fundamental problems with the current approach using novel, theoretically well-founded machine learning (ML) methods to learn interpretable models from data. Aim 1. Learn an interpretable feature representation from publicly available, high-throughput brain data. High-dimensionality, hidden variables, and complex feature correlations create a discrepancy between predictability (i.e., observed statistical associations) and true biological interactions. To increase the chance to identify true positive biomarkers, we need new feature selection criteria to learn a model that better explains rather than simply predicts the outcome. To do so, our proposed ML algorithms will identify the genes that are likely to give a meaningful explanation of the outcome (Aβ or tau level) by inferring both the functions of genes in the cellular processes contributing to AD and the gene interaction network from many existing brain datasets. Aim 2. Make interpretable predictions using a unified framework to explain model predictions. Due to disease heterogeneity, complex models (e.g., deep learning or ensemble models) often more accurately describe relationships between genes and an outcome than simpler, linear models, but lack interpretability. We will develop a novel ML framework that interprets complex model predictions by estimating the importance of each feature to a specific prediction, which will identify features of high importance for each individual as personalized markers and classify subjects based on these importance estimates. Aim 3. Validate the identified candidate biomarkers using powerful worm models of AD. Analyzing observational data without doing interventional experiments cannot prove causal relationships. In collaboration with co-I Matt Kaeberlein, we will utilize powerful nematode models of AD to test our hypotheses on the role of certain genes as disease modifiers, and develop a new way to refine the models based on this knowledge. Successful completion of this project will result in previously unknown molecular basis for Aβ and tau levels, potential therapeutic targets, and general ML techniques widely applicable to many other data science problems.
项目概要 阿尔茨海默氏病(AD)是一个紧迫的国家和国际研究重点。淀粉样斑块和 神经原纤维缠结是 AD 的标志。它们的构建模块分别是淀粉样蛋白-β (Aβ) 和 tau。 目前,我们对影响斑块和缠结形成以及影响斑块和缠结形成的基因组缺乏了解。 对这些有毒肽的保护性和病理性反应。 生物学家现在正在收集人类脑组织的基因表达数据以及 Aβ 和 tau 蛋白测量值。这 当前的方法试图找到一组最能预测结果的特征(此处为基因表达水平)(Aβ 或 tau 水平)。所识别的特征、生物标志物可以帮助确定斑块和缠结的分子基础。 不幸的是,假阳性生物标志物非常常见,复制成功率低就证明了这一点。 独立数据和临床实践的成功率较低(低于 1%)。我们寻求从根本上改变当前的 通过使用新颖的方法解决当前方法的三个基本问题,生物标志物发现的范例 理论上有充分依据的机器学习(ML)方法,用于从数据中学习可解释的模型。 目标 1. 从公开的、高通量的大脑数据中学习可解释的特征表示。 高维、隐藏变量和复杂的特征相关性造成了 可预测性(即观察到的统计关联)和真实的生物相互作用。为了增加机会 识别真正的阳性生物标志物,我们需要新的特征选择标准来学习更好地解释的模型 而不是简单地预测结果。为此,我们提出的机器学习算法将识别哪些基因 通过推断基因的功能,可能对结果(Aβ 或 tau 水平)给出有意义的解释 来自许多现有大脑数据集的 AD 细胞过程和基因相互作用网络。 目标 2. 使用统一的框架来解释模型预测,做出可解释的预测。由于 疾病异质性,复杂模型(例如深度学习或集成模型)通常可以更准确地描述 基因与结果之间的关系比更简单的线性模型更简单,但缺乏可解释性。我们将 开发一个新颖的机器学习框架,通过估计每个模型的重要性来解释复杂的模型预测 特征到特定的预测,这将识别出对每个人来说高度重要的特征作为个性化的 标记并根据这些重要性估计对主题进行分类。 目标 3. 使用强大的 AD 蠕虫模型验证已识别的候选生物标志物。分析中 没有做介入实验的观察数据无法证明因果关系。合作中 与合作者 Matt Kaeberlein 一起,我们将利用强大的 AD 线虫模型来检验我们对该作用的假设 某些基因作为疾病调节剂,并开发一种新的方法来基于这些知识来完善模型。 该项目的成功完成将带来以前未知的 Aβ 和 tau 水平的分子基础, 潜在的治疗目标,以及广泛适用于许多其他数据科学问题的通用机器学习技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Su-In Lee其他文献

Su-In Lee的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Su-In Lee', 18)}}的其他基金

Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets
可解释的机器学习识别阿尔茨海默病的治疗目标
  • 批准号:
    10613437
  • 财政年份:
    2019
  • 资助金额:
    $ 58.2万
  • 项目类别:
Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets
可解释的机器学习识别阿尔茨海默病的治疗目标
  • 批准号:
    10347341
  • 财政年份:
    2019
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10437684
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Application of Data Sciences in Traumatic Brain Injury
数据科学在脑外伤中的应用
  • 批准号:
    9685513
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10224845
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10020414
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10260483
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10438909
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10670111
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10042623
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:

相似海外基金

How Does Particle Material Properties Insoluble and Partially Soluble Affect Sensory Perception Of Fat based Products
不溶性和部分可溶的颗粒材料特性如何影响脂肪基产品的感官知觉
  • 批准号:
    BB/Z514391/1
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Training Grant
BRC-BIO: Establishing Astrangia poculata as a study system to understand how multi-partner symbiotic interactions affect pathogen response in cnidarians
BRC-BIO:建立 Astrangia poculata 作为研究系统,以了解多伙伴共生相互作用如何影响刺胞动物的病原体反应
  • 批准号:
    2312555
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Standard Grant
RII Track-4:NSF: From the Ground Up to the Air Above Coastal Dunes: How Groundwater and Evaporation Affect the Mechanism of Wind Erosion
RII Track-4:NSF:从地面到沿海沙丘上方的空气:地下水和蒸发如何影响风蚀机制
  • 批准号:
    2327346
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Standard Grant
Graduating in Austerity: Do Welfare Cuts Affect the Career Path of University Students?
紧缩毕业:福利削减会影响大学生的职业道路吗?
  • 批准号:
    ES/Z502595/1
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Fellowship
感性個人差指標 Affect-X の構築とビスポークAIサービスの基盤確立
建立个人敏感度指数 Affect-X 并为定制人工智能服务奠定基础
  • 批准号:
    23K24936
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Insecure lives and the policy disconnect: How multiple insecurities affect Levelling Up and what joined-up policy can do to help
不安全的生活和政策脱节:多种不安全因素如何影响升级以及联合政策可以提供哪些帮助
  • 批准号:
    ES/Z000149/1
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Research Grant
How does metal binding affect the function of proteins targeted by a devastating pathogen of cereal crops?
金属结合如何影响谷类作物毁灭性病原体靶向的蛋白质的功能?
  • 批准号:
    2901648
  • 财政年份:
    2024
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Studentship
Investigating how double-negative T cells affect anti-leukemic and GvHD-inducing activities of conventional T cells
研究双阴性 T 细胞如何影响传统 T 细胞的抗白血病和 GvHD 诱导活性
  • 批准号:
    488039
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Operating Grants
New Tendencies of French Film Theory: Representation, Body, Affect
法国电影理论新动向:再现、身体、情感
  • 批准号:
    23K00129
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The Protruding Void: Mystical Affect in Samuel Beckett's Prose
突出的虚空:塞缪尔·贝克特散文中的神秘影响
  • 批准号:
    2883985
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了