Scalable Bayesian Statistical Machine Learning for Multi-modal Data with Applications to Multiple Sclerosis

多模态数据的可扩展贝叶斯统计机器学习及其在多发性硬化症中的应用

基本信息

  • 批准号:
    2740724
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2022
  • 资助国家:
    英国
  • 起止时间:
    2022 至 无数据
  • 项目状态:
    未结题

项目摘要

Within this project, we undertake the challenge of effectively managing extensive and complex datasets, as exemplified by the NO.MS clinical dataset. The primary objective is to streamline the inherent complexity of these datasets by uncovering underlying latent variables. This simplification is particularly vital when contending with high-dimensional data, where the challenge lies in distilling an abundance of dimensions into a more concise set of broader covariates that remain accurate representations of the data. This concept of distilling latent variables extends its relevance to diverse fields beyond our immediate study.The NO.MS dataset, provided by Novartis, serves as a focal point of interest. It encompasses a wealth of data on individuals affected by multiple sclerosis, distinguishing itself as one of the largest datasets of its kind. This distinction arises from the inclusion of numerous MRI brain scans, contributing to its high dimensionality due to the myriad of pixels within each scan. Consequently, this dataset bears significant potential for unravelling insights into the disease. However, from an analytical standpoint, it presents considerable challenges. This complexity stems from the dataset's amalgamation of discrete data, such as disability scores, and continuous data, exemplified by the pixel values within the MRI scans. Furthermore, the dataset draws from multiple studies, each capturing distinct facets of patient visits, resulting in a substantial amount of missing data.The project's core objectives comprise of two pivotal contributions:First and foremost, we aim to construct a model that can effectively unveil an interpretable representation of the lower-dimensional latent space. Our approach relies heavily on Bayesian statistics, a statistical framework that integrates prior beliefs into modelling, subsequently updating them based on the incoming data. This model must possess the versatility to accommodate both continuous and discrete data, offering a solution for datasets like NO.MS. Furthermore, we prioritize scalability, recognizing the impracticality of conventional methods for managing large, high-dimensional datasets, such as the Novartis multiple sclerosis data. In addition, our model should autonomously determine the optimal number of latent variables required to represent the data accurately. While existing models may address individual aspects of these challenges, the unique aspect of our approach is the integration of solutions into a cohesive whole.Secondly, we intend to apply this comprehensive model to the NO.MS dataset to deepen our understanding of multiple sclerosis. This can be achieved by analysing the latent factors unveiled, in collaboration with medical experts. Additionally. These latent factors furnish a simplified representation of the data, which can, in turn, be employed in conjunction with more computationally intensive models. This streamlined representation enhances the efficiency of our analyses compared to conventional approaches.This project falls within the EPSRC Statistics and Applied Probability research area and is carried out in collaboration with Novartis, it is supervised by Dr Habib Ganjgahi, Prof Tom Nichols and Prof Chris Holmes.
在这个项目中,我们承担了有效管理广泛而复杂的数据集的挑战,例如NO.MS临床数据集。主要目标是通过揭示潜在的潜在变量来简化这些数据集的固有复杂性。当处理高维数据时,这种简化尤为重要,其中的挑战在于将丰富的维度提炼成一组更简洁的更广泛的协变量,这些协变量仍然是数据的准确表示。这种提取潜在变量的概念将其相关性扩展到我们当前研究之外的各个领域。诺华公司提供的NO.MS数据集是我们感兴趣的焦点。它包含了大量关于受多发性硬化症影响的个人的数据,使其成为同类中最大的数据集之一。这种区别来自于包含大量的MRI脑部扫描,由于每个扫描内的无数像素,导致其高维数。因此,该数据集具有揭示疾病的重要潜力。然而,从分析的角度来看,它提出了相当大的挑战。这种复杂性源于数据集的离散数据(如残疾评分)和连续数据(如MRI扫描中的像素值)的合并。此外,该数据集来自多个研究,每个研究都捕捉了患者就诊的不同方面,导致大量数据缺失。该项目的核心目标包括两个关键贡献:首先,我们的目标是构建一个模型,可以有效地揭示低维潜在空间的可解释表示。我们的方法在很大程度上依赖于贝叶斯统计,这是一种统计框架,将先前的信念整合到建模中,随后根据传入的数据更新它们。该模型必须具有适应连续和离散数据的多功能性,为NO.MS等数据集提供解决方案。此外,我们优先考虑可扩展性,认识到管理大型高维数据集(如诺华公司多发性硬化症数据)的传统方法不切实际。此外,我们的模型应该自主确定准确表示数据所需的潜在变量的最佳数量。虽然现有的模型可以解决这些挑战的各个方面,但我们方法的独特之处在于将解决方案整合成一个有凝聚力的整体。其次,我们打算将这个综合模型应用于NO.MS数据集,以加深我们对多发性硬化症的理解。这可以通过与医学专家合作分析所揭示的潜在因素来实现。另外。这些潜在因素提供了数据的简化表示,反过来,可以与计算密集型模型结合使用。与传统方法相比,这种简化的表示方法提高了我们分析的效率。该项目福尔斯属于EPSRC统计和应用概率研究领域,并与诺华公司合作进行,由Habib Ganjgahi博士,Tom Nichols教授和Chris Holmes教授监督。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

多元纵向数据与复发事件和终止事件的Bayesian联合模型研究
  • 批准号:
    82173628
  • 批准年份:
    2021
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
三维地质模型约束下地球化学场的Bayesian-MCMC推断
  • 批准号:
    42072326
  • 批准年份:
    2020
  • 资助金额:
    63 万元
  • 项目类别:
    面上项目
基于Bayesian Kriging模型的压射机构稳健优化设计基础研究
  • 批准号:
    51875209
  • 批准年份:
    2018
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
X射线图像分析中的MCMC-Bayesian理论与计算方法研究
  • 批准号:
    U1830105
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    联合基金项目
基于Bayesian位移场的SAR图像精确配准方法研究
  • 批准号:
    41601345
  • 批准年份:
    2016
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
多结局Bayesian联合生存模型及糖尿病并发症预测研究
  • 批准号:
    81673274
  • 批准年份:
    2016
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
基于Meta流行病学和Bayesian方法构建针刺干预无偏倚风险效果评价体系研究
  • 批准号:
    81403276
  • 批准年份:
    2014
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
BtoC电子商务中基于分层Bayesian网络的信任与声誉计算理论研究
  • 批准号:
    71302080
  • 批准年份:
    2013
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Bayesian网络的坚硬顶板条件下煤与瓦斯突出预警控制机理研究
  • 批准号:
    51274089
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
Bayesian实物期权及在信用风险决策中的应用
  • 批准号:
    71071027
  • 批准年份:
    2010
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目

相似海外基金

Bayesian Statistical Learning for Robust and Generalizable Causal Inferences in Alzheimer Disease and Related Disorders Research
贝叶斯统计学习在阿尔茨海默病和相关疾病研究中进行稳健且可推广的因果推论
  • 批准号:
    10590913
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Interpretable Bayesian Non-linear statistical learning models for multi-omics data integration
用于多组学数据集成的可解释贝叶斯非线性统计学习模型
  • 批准号:
    10714882
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Bayesian Prediction Theory and Information Geometry for Non-regular and Quantum Statistical Models
非正则和量子统计模型的贝叶斯预测理论和信息几何
  • 批准号:
    23K11006
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
iCyberPlatform - An innovative cybersecurity platform that uses AI, ML, Bayesian statistical models and the LDA algorithm to provide enhanced cyber defence against breaches
iCyber​​Platform - 一个创新的网络安全平台,使用人工智能、机器学习、贝叶斯统计模型和 LDA 算法来提供针对违规的增强网络防御
  • 批准号:
    10037731
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Scalable and Robust Bayesian Inference for Implicit Statistical Models
隐式统计模型的可扩展且稳健的贝叶斯推理
  • 批准号:
    FT210100260
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    ARC Future Fellowships
New Bayesian statistical mechanical approaches to integrative structural biology using unassigned NMR and mass spectrometry
使用未分配的核磁共振和质谱进行综合结构生物学的新贝叶斯统计机械方法
  • 批准号:
    RGPIN-2022-03287
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Learning to See More: Better Bayesian Track Before Detect using Statistical Machine Learning
学习了解更多:使用统计机器学习在检测前更好地进行贝叶斯跟踪
  • 批准号:
    2447388
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Studentship
Bayesian Statistical Development of Microseismic focal mechanism Inversion with Well Logging Geophysical Data
测井地球物理数据反演微震震源机制的贝叶斯统计发展
  • 批准号:
    20K05394
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Novel Bayesian statistical tools for integrating multi-omics data to help elucidate the genomic etiology of complex phenotypes
用于整合多组学数据的新型贝叶斯统计工具,有助于阐明复杂表型的基因组病因学
  • 批准号:
    10671498
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
The method to determine the probability of disease severity by bayesian statistical analysis in a small number of patient data.
通过对少量患者数据进行贝叶斯统计分析来确定疾病严重程度概率的方法。
  • 批准号:
    20K12716
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了