Health Data Science CDT

健康数据科学 CDT

基本信息

  • 批准号:
    2873903
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2023
  • 资助国家:
    英国
  • 起止时间:
    2023 至 无数据
  • 项目状态:
    未结题

项目摘要

This project falls within the EPSRC Artificial Intelligence and Robotics research area.Current generative models, while robust in various applications, struggle to represent the manifold complexities and transient dynamics of biological and chemical systems. This is particularly evident in biomedical applications, such as single-cell RNA sequencing, where the destructive nature of cross-sectional samples necessitates the inference of cell dynamics from static, sparse data points [1]. Similarly, in biochemistry, the simulation of transient states in chemical reactions is limited to physically plausible paths beyond simple straight-line trajectories [2].This project proposes the development of novel generative modeling frameworks that integrate geometric learning and physical laws directly into the model architecture. The expected outcome is more effective generative models for understanding dynamic systems in biomedical research and chemistry, better reflecting (and thus understanding) the underlying dynamics of these systems and speeding up simulations.Geometric ModelsWe propose a method called Metric Flow Matching (MFM) [3]-a novel generative framework designed for trajectory inference. It utilizes data- induced Riemannian metrics to learn approximate geodesics. By adopting geodesic paths, MFM adheres more closely to the data's underlying geometry and demonstrates state-of-the-art performance in predicting single-cell trajectories.Further improvements to MFM could enhance model specificity and accuracy for single-cell trajectories-encoding task-specific biases [4], addressing data imbalance by incorporating optimal transport plans, or refining simulation-free couplings to respect the manifold assumption by designing transport plan with heat kernels.Physics-InformedOur next objective is integrating physical constraints (e.g., Langevin dynamics [5]) to enhance molecular transition path sampling [2], Molecular Dynamics [6], or Docking [7]. These constraints could be incorporated into generative models similarly to MFM, replacing geometric bias with physical ones, akin to methods explored in Physics-Informed Neural Networks and Neural Operators instead of Geometric Metrics proposed in MFM.For instance, in Molecular Dynamics, ensuring balanced conditions characteristic of these dynamics are preserved, along with the corresponding Fokker-Planck equation, has the potential to significantly speed up chemical simulations, as initially presented by [6]. Furthermore,by designing suitable biases, these models could also improve capturing the full coverage of complex distributions dictated by Boltzmann-type energies [8].References[1] Lavenant, Hugo, et al. "Towards a mathematical theory of trajectory inference." arXiv preprint arXiv:2102.09204 (2021)[2] Holdijk, Lars, et al. "Stochastic optimal control for collective variable free sampling of molecular transition paths." Advances in Neural Information Processing Systems 36 (2024).[3] Kapusniak, Kacper, et al. "Metric Flow Matching for Smooth Interpolations on the Data Manifold." arXiv preprint arXiv:2405.14780 (2024).[4] Neklyudov, Kirill, et al. "A computational framework for solving Wasserstein Lagrangian flows." arXiv preprint arXiv:2310.10649 (2023).[5] Bussi, Giovanni, and Michele Parrinello. "Accurate sampling using Langevin dynamics." Physical Review E-Statistical, Nonlinear, and Soft Matter Physics 75.5 (2007): 056707.[6] Klein, Leon, et al. "Timewarp: Transferable acceleration of molecular dynamics by learning time-coarsened dynamics." Advances in Neural Information Processing Systems 36 (2024).[7] Corso, Gabriele, et al. "Diffdock: Diffusion steps, twists, and turns for molecular docking." arXiv preprint arXiv:2210.01776(2022).[8] Akhound-Sadegh, Tara, et al. "Iterated denoising energy matching for sampling from Boltzmann densities." arXiv preprint arXiv:2402.06121 (2024).
该项目属于EPSRC人工智能和机器人研究领域的福尔斯。当前的生成模型虽然在各种应用中具有鲁棒性,但难以表示生物和化学系统的多种复杂性和瞬态动力学。这在生物医学应用中尤其明显,例如单细胞RNA测序,其中横截面样品的破坏性性质需要从静态稀疏数据点推断细胞动力学[1]。类似地,在生物化学中,化学反应中瞬态的模拟仅限于物理上合理的路径,而不是简单的直线轨迹[2]。该项目提出了新的生成建模框架的开发,将几何学习和物理定律直接集成到模型架构中。预期的结果是更有效的生成模型,用于理解生物医学研究和化学中的动态系统,更好地反映(从而理解)这些系统的潜在动力学并加速模拟。几何模型我们提出了一种称为度量流匹配(MFM)的方法[3]-一种为轨迹推断而设计的新颖生成框架。它利用数据诱导的黎曼度量来学习近似测地线。通过采用测地线路径,MFM更紧密地遵循数据的底层几何结构,并在预测单细胞轨迹方面展示了最先进的性能。对MFM的进一步改进可以提高单细胞轨迹编码任务特定偏差的模型特异性和准确性[4],通过结合最佳运输计划解决数据不平衡问题,或者通过设计具有热内核的运输计划来改进无模拟耦合以尊重流形假设。物理信息我们的下一个目标是集成物理约束(例如,Langevin动力学[5])以增强分子跃迁路径采样[2]、分子动力学[6]或对接[7]。这些约束可以类似于MFM被纳入生成模型中,用物理偏差代替几何偏差,类似于在物理信息神经网络和神经运算符中探索的方法,而不是在MFM中提出的几何偏差。例如,在分子动力学中,确保这些动力学的平衡条件特征被保留,沿着相应的福克-普朗克方程,有可能显着加快化学模拟,如[6]最初提出的。此外,通过设计合适的偏置,这些模型还可以改善对玻尔兹曼型能量所指示的复杂分布的完全覆盖的捕获[8]。参考文献[1] Laundry,Hugo等人,“Towards a mathematical theory of trajectory inference.“arXiv预印本arXiv:2102.09204(2021)[2] Holdijk,Lars,et al.“Stochastic optimal control for collective variable free sampling of molecular transition paths.“神经信息处理系统的进展36(2024)。[3]Kapusniak,Kacper等人,“数据流形上平滑插值的度量流匹配。arXiv预印本arXiv:2405.14780(2024)。[4]Neklyudov,Kirill等人,“解决Wasserstein拉格朗日流的计算框架。arXiv预印本arXiv:2310.10649(2023)。[5]布西,乔瓦尼,和米歇尔帕里内洛。“使用朗之万动力学进行精确采样。“物理评论电子统计、非线性和软物质物理75.5(2007):056707。[6]Klein,Leon等人,“Timewarp:通过学习时间粗化动力学来实现分子动力学的可转移加速。神经信息处理系统的进展36(2024)。[7]Corso,Gabriele等人,“Diffdock:分子对接的扩散步骤、扭曲和转折。arXiv预印本arXiv:2210.01776(2022)。[8]Akhound-Sadegh,塔拉等人,“从玻尔兹曼密度采样的迭代去噪能量匹配。arXiv预印本arXiv:2402.06121(2024)。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Health Data Science CDT
健康数据科学 CDT
  • 批准号:
    2873841
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
Health Data Science CDT
健康数据科学 CDT
  • 批准号:
    2873914
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
Health Data Science CDT
健康数据科学 CDT
  • 批准号:
    2873918
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
Health Data Science CDT
健康数据科学 CDT
  • 批准号:
    2876277
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
A data science framework for transforming electronic health records into real-world evidence
将电子健康记录转化为现实世界证据的数据科学框架
  • 批准号:
    10664706
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Leveraging Data Science Applications to Improve Children's Environmental Health in Sub-Saharan Africa (DICE)
利用数据科学应用改善撒哈拉以南非洲儿童的环境健康 (DICE)
  • 批准号:
    10714773
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
DSpace: Utilizing Data Science to Predict and Improve Health Outcomes in Pediatric HIV
DSpace:利用数据科学预测和改善儿童艾滋病毒的健康结果
  • 批准号:
    10749123
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
University of South Carolina Big Data Health Science Conference
南卡罗来纳大学大数据健康科学会议
  • 批准号:
    10751656
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Health Data Science EPSRC CDT
健康数据科学 EPSRC CDT
  • 批准号:
    2873831
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
Health Data Science CDT
健康数据科学 CDT
  • 批准号:
    2873843
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了