Multiscale data geometric networks for learning representations and dynamics of biological systems

用于学习生物系统表示和动力学的多尺度数据几何网络

基本信息

  • 批准号:
    2327211
  • 负责人:
  • 金额:
    $ 49.82万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

Recent years have seen significant volumes of high throughput, high dimensional, biomedical data arising from single cell sequencing technologies. Further, in contrast to past data of this type, current practices involve the collection of multiple single cell datasets (e.g., for each patient in a large cohort), which can represent data over time or in different conditions and can be analyzed computationally as point clouds. There is a great need for new mathematical and machine learning techniques to be able to process these types of complex data to gain meaningful and predictive insight on healthy and disease processes. While the majority of machine learning techniques used in the biomedical domain have been supervised techniques arising from language or vision (image) models, this project focuses on developing multiscale geometric and topological representations of more complex data structures. Such representations allow us to combine advances in several fields at the forefront of data science, including geometric deep learning, manifold learning, and harmonic analysis in order to analyze and predict from this data in an interpretable way. The research will include several biomedical applications, such as characterizing immune response in COVID-19, tracking the progress of metastatic cancer, predicting the effectiveness of immunotherapy, and understanding differentiation. Furthermore, the challenges addressed by these methods will enable new advances in a wide range of fields where complex high throughput data is collected in varying experimental environments. The project will provide representation learning techniques to explore and featurize high dimensional and complex datatypes including point clouds, graphs collected in a variety of conditions in order to perform machine learning tasks. Thrust 1 will involve the development of data geometric features to characterize point cloud data, based on which a novel class of neural networks will be created for regression on single cell data from a variety of systems. Thrust 2 will focus on methods for preserving directed information, by constructing asymmetric kernels and using these kernels for embedding, inference, and feature prediction. This will lead to the creation of directed graph neural networks that utilize geometric scattering as defined on a directional graph Laplacian of point cloud data. This will be used to learn and process data from gene regulatory and metabolic networks. Thrust 3 will focus here on inferring dynamics for interpolation of continuous dynamics from static snapshot single cell data using optimal transport-regularized neural ODEs and PDEs and producing interpretations of the underlying generative models. Further, it will involve representing dynamics quantitatively using data geometry and topology for prediction and classification, and will be validated on cancer and calcium signaling data from epithelial cells. The techniques developed here will provide fundamental advances in the use of neural networks to represent and make predictions on point cloud data, as well as enable new ways to tackle the problem of tracking dynamic biological processes over them.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,单细胞测序技术产生了大量高通量、高维的生物医学数据。此外,与过去的此类数据相比,目前的做法涉及收集多个单细胞数据集(例如,针对大型队列中的每个患者),这些数据集可以表示随时间或不同条件下的数据,并且可以作为点云进行计算分析。我们非常需要新的数学和机器学习技术来处理这些类型的复杂数据,从而获得有关健康和疾病过程的有意义和预测性的见解。虽然生物医学领域使用的大多数机器学习技术都是由语言或视觉(图像)模型引起的监督技术,但该项目侧重于开发更复杂数据结构的多尺度几何和拓扑表示。这样的表示使我们能够结合数据科学前沿的几个领域的进展,包括几何深度学习,流形学习和谐波分析,以便以可解释的方式分析和预测这些数据。该研究将包括几个生物医学应用,如表征COVID-19的免疫反应,追踪转移性癌症的进展,预测免疫治疗的有效性,以及了解分化。此外,这些方法所解决的挑战将使在不同实验环境中收集复杂高通量数据的广泛领域取得新进展。该项目将提供表征学习技术,以探索和展示高维和复杂的数据类型,包括点云,在各种条件下收集的图,以执行机器学习任务。推力1将涉及数据几何特征的发展,以表征点云数据,在此基础上,将创建一类新的神经网络,用于回归来自各种系统的单细胞数据。推力2将侧重于通过构造非对称核并使用这些核进行嵌入、推理和特征预测来保存有向信息的方法。这将导致有向图神经网络的创建,利用在点云数据的有向图拉普拉斯上定义的几何散射。这将用于学习和处理来自基因调控和代谢网络的数据。推力3将重点关注使用最佳传输正则化神经ode和pde从静态快照单细胞数据推断连续动态插值的动力学,并产生潜在生成模型的解释。此外,它将涉及使用数据几何和拓扑来预测和分类动态定量表示,并将在上皮细胞的癌症和钙信号数据上进行验证。这里开发的技术将在使用神经网络来表示和预测点云数据方面提供根本性的进步,并提供新的方法来解决跟踪动态生物过程的问题。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Smita Krishnaswamy其他文献

Guided Generative Protein Design using Regularized Transformers
使用正则化变压器引导生成蛋白质设计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Egbert Castro;Abhinav Godavarthi;Julian Rubinfien;Kevin B. Givechian;Dhananjay Bhaskar;Smita Krishnaswamy
  • 通讯作者:
    Smita Krishnaswamy
Alternative splicing across the C. elegans nervous system
线虫神经系统中的可变剪接
  • DOI:
    10.1038/s41467-025-58293-5
  • 发表时间:
    2025-05-16
  • 期刊:
  • 影响因子:
    15.700
  • 作者:
    Alexis Weinreb;Erdem Varol;Alec Barrett;Rebecca M. McWhirter;Seth R. Taylor;Isabel Courtney;Manasa Basavaraju;Abigail Poff;John A. Tipps;Becca Collings;Smita Krishnaswamy;David M. Miller;Marc Hammarlund
  • 通讯作者:
    Marc Hammarlund
Embedding the single-cell experimental variable state space to reveal manifold structure of drug perturbation effects in breast cancer
嵌入单细胞实验可变状态空间揭示乳腺癌药物扰动效应的多种结构
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    William S. Chen;Nevena Zivanovic;D. V. Dijk;Guy Wolf;B. Bodenmiller;Smita Krishnaswamy
  • 通讯作者:
    Smita Krishnaswamy
Modeling uniquely human gene regulatory function in humanized mice
在人源化小鼠中模拟独特的人类基因调控功能
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Dutrow;Deena Emera;Kristina Yim;Severin Uebbing;Acadia A. Kocher;M. Krenzer;T. Nottoli;Daniel B. Burkhardt;Smita Krishnaswamy;A. Louvi;J. Noonan
  • 通讯作者:
    J. Noonan
Diffusion Curvature for Estimating Local Curvature in High Dimensional Data
用于估计高维数据中局部曲率的扩散曲率
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dhananjay Bhaskar;Kincaid MacDonald;O. Fasina;Dawson Thomas;Bastian Alexander Rieck;Ian M. Adelstein;Smita Krishnaswamy
  • 通讯作者:
    Smita Krishnaswamy

Smita Krishnaswamy的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Smita Krishnaswamy', 18)}}的其他基金

CAREER: Deep representation learning for exploration and inference in biomedical data
职业:用于生物医学数据探索和推理的深度表示学习
  • 批准号:
    2047856
  • 财政年份:
    2021
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于高频信息下高维波动率矩阵估计及应用
  • 批准号:
    71901118
  • 批准年份:
    2019
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
半参数空间自回归面板模型的有效估计与应用研究
  • 批准号:
    71961011
  • 批准年份:
    2019
  • 资助金额:
    16.0 万元
  • 项目类别:
    地区科学基金项目
高频数据波动率统计推断、预测与应用
  • 批准号:
    71971118
  • 批准年份:
    2019
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究
  • 批准号:
    61502059
  • 批准年份:
    2015
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
体数据表达与绘制的新方法研究
  • 批准号:
    61170206
  • 批准年份:
    2011
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
一类新Regime-Switching模型及其在金融建模中的应用研究
  • 批准号:
    11061041
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

OAC Core: OAC Core Projects: GPU Geometric Data Processing
OAC 核心:OAC 核心项目:GPU 几何数据处理
  • 批准号:
    2403239
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
Dynamic embedding time series models in functional brain imaging
功能性脑成像中的动态嵌入时间序列模型
  • 批准号:
    10711521
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Studies on topological and geometric structure analysis and visualization of spatio-temporal data
时空数据拓扑几何结构分析与可视化研究
  • 批准号:
    23K11020
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Integrating cancer genomics and spatial architecture of tumor infiltrating lymphocytes
整合癌症基因组学和肿瘤浸润淋巴细胞的空间结构
  • 批准号:
    10637960
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Reliable post hoc interpretations of deep learning in genomics
基因组学深度学习的可靠事后解释
  • 批准号:
    10638753
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Models for accumulation of evidence through sequences in a navigation-based, decision-making task
在基于导航的决策任务中通过序列积累证据的模型
  • 批准号:
    10608293
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Renewed bone remodeling after pausing long-term bisphosphonate use: Does it replace regions of impaired bone quality and restore mechanical integrity?
暂停长期使用双膦酸盐后重新进行骨重塑:它是否可以替代骨质量受损的区域并恢复机械完整性?
  • 批准号:
    10656954
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Statistical models for the integrative analysis of complex biomedical images with manifold structure
具有流形结构的复杂生物医学图像综合分析的统计模型
  • 批准号:
    10590469
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Taking Snapshots of Enzymatic Reactions Using X-ray Crystallography and Spectroscopy
使用 X 射线晶体学和光谱学拍摄酶反应快照
  • 批准号:
    10623717
  • 财政年份:
    2023
  • 资助金额:
    $ 49.82万
  • 项目类别:
Novel statistical methods for data with non-Euclidean geometric structure
非欧几何结构数据的新颖统计方法
  • 批准号:
    DP220102232
  • 财政年份:
    2022
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Discovery Projects
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了