Latent variable modeling of complex high-dimensional data

复杂高维数据的潜变量建模

基本信息

  • 批准号:
    RGPIN-2019-05915
  • 负责人:
  • 金额:
    $ 1.17万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

As an Assistant Professor in Data Science my research work consists of developing novel statistical methods to analyze large complex data structures so that important scientific questions can be answered. In particular, my proposed research program is focused on the development of techniques to analyze data when crucial information is absent. While my methods can be applied to a wide range of areas in the Natural Sciences and Engineering, I will consider two main application themes over the next five years: 1) analysis of electrical load data from substations and 2) DNA and RNA sequencing data from single cells. In Theme 1, I will consider aggregated energy consumption data measured over time at substations that serve a fixed number of consumers from different types (e.g., residential, commercial and industrial). The individual consumer-level energy usage curves are not observed, only the sums of individuals' energy usage. My goal is to develop novel statistical methods to infer the typical weekly energy usage curve for each type of consumer using the substation aggregated data and additional information, such as temperature and characteristics of the substations (e.g., capacity and number of low voltage feeders). In addition, I will cluster substations into different groups according to their consumer type-specific energy usage curves. This work will allow power companies around the world to better understand energy usage in order to provide adequate energy at low cost. In Theme 2, I will analyze DNA and RNA sequencing data obtained from individual cells. Because the amount of DNA/RNA material per cell is limited, the resulting single-cell sequencing data contain technical noise and a large amount of missing information. My goal is to build new statistical tools to infer the different groups of cells comprising a tissue based on their DNA/RNA sequencing data taking into account the challenges arising from this type of technology. My work on single-cell genomics will provide scientists in various areas of biology with the adequate set of statistical tools to assess the genomic composition of cells, which will lead to a better understanding of how individual cells differentiate to form tissues and how tissues work. My proposed research team consists of two MSc and two PhD students working under Theme 1 and one MSc and two PhD students working under Theme 2. All the resulting research work under Themes 1 and 2 will be submitted for publication at high-impact scientific journals, as well as presented by the students and myself at relevant conferences. In addition, all statistical methods developed will be implemented in the free software environment R and will include user-friendly tutorial guides.
作为数据科学的助理教授,我的研究工作包括开发新的统计方法来分析大型复杂的数据结构,以便回答重要的科学问题。特别是,我提出的研究计划的重点是技术的发展,分析数据时,关键信息是缺席。虽然我的方法可以应用于自然科学和工程的广泛领域,但我将在未来五年内考虑两个主要的应用主题:1)分析变电站的电力负荷数据,2)单细胞的DNA和RNA测序数据。在主题1中,我将考虑在变电站随时间测量的汇总能耗数据,这些变电站为来自不同类型的固定数量的消费者提供服务(例如,住宅、商业和工业)。没有观察到个人消费者水平的能源使用曲线,只有个人能源使用的总和。我的目标是开发新的统计方法,使用变电站汇总数据和附加信息(如变电站的温度和特性)来推断每种类型的消费者的典型每周能源使用曲线(例如,低压馈线的容量和数量)。此外,我将根据用户类型的特定能量使用曲线将变电站聚类到不同的组中。这项工作将使世界各地的电力公司更好地了解能源使用情况,以便以低成本提供充足的能源。在主题2中,我将分析从单个细胞中获得的DNA和RNA测序数据。由于每个细胞的DNA/RNA材料的量是有限的,因此得到的单细胞测序数据包含技术噪声和大量缺失信息。我的目标是建立新的统计工具,根据DNA/RNA测序数据推断组成组织的不同细胞群,同时考虑到这种技术带来的挑战。我在单细胞基因组学方面的工作将为生物学各个领域的科学家提供足够的统计工具来评估细胞的基因组组成,这将有助于更好地了解单个细胞如何分化形成组织以及组织如何工作。我提议的研究团队由两名硕士和两名博士生在主题1下工作,一名硕士和两名博士生在主题2下工作。主题1和主题2下的所有研究成果将提交给高影响力的科学期刊发表,并由学生和我本人在相关会议上发表。此外,所有开发的统计方法都将在免费软件环境R中实施,并将包括用户友好的教程指南。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

PedrosoEstevamdeSouza, Camila其他文献

PedrosoEstevamdeSouza, Camila的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('PedrosoEstevamdeSouza, Camila', 18)}}的其他基金

Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2021
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Drp1—Variable结构域在继发性脊髓损伤中调节线粒体功能的机制研究
  • 批准号:
    81974335
  • 批准年份:
    2019
  • 资助金额:
    54.0 万元
  • 项目类别:
    面上项目
基于蛋白质组学和代谢组学整合分析的Paraconiothyrium variable GHJ-4降解木质素的分子机制
  • 批准号:
    31200450
  • 批准年份:
    2012
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
考虑外源变量的空间copula插值模型的开发及其在降雨和地下水水质插值上的验证
  • 批准号:
    41101020
  • 批准年份:
    2011
  • 资助金额:
    28.0 万元
  • 项目类别:
    青年科学基金项目
人源化抗肿瘤单链抗体的筛选
  • 批准号:
    30300313
  • 批准年份:
    2003
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

A latent variable model for quantifying social behavior in rodents
用于量化啮齿类动物社会行为的潜变量模型
  • 批准号:
    10535865
  • 财政年份:
    2022
  • 资助金额:
    $ 1.17万
  • 项目类别:
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2021
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
A Pragmatic Latent Variable Learning Approach Aligned with Clinical Practice
符合临床实践的实用潜变量学习方法
  • 批准号:
    10033908
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
A Pragmatic Latent Variable Learning Approach Aligned with Clinical Practice
符合临床实践的实用潜变量学习方法
  • 批准号:
    10212944
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    DGECR-2019-00345
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Launch Supplement
Latent variable modeling of complex high-dimensional data
复杂高维数据的潜变量建模
  • 批准号:
    RGPIN-2019-05915
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
CAREER: Advancing Latent Variable Statistical Modeling for the Analysis of Big and Complex Longitudinal Data to Promote Personalized Learning
职业:推进潜变量统计模型分析大而复杂的纵向数据以促进个性化学习
  • 批准号:
    1848451
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Continuing Grant
Measuring the individual: Personalized latent variable models from ecological momentary assessments
衡量个体:来自生态瞬时评估的个性化潜变量模型
  • 批准号:
    9906952
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
Methods of analysis and inference for social survey data within the framework of latent variable modeling and pairwise likelihood
在潜变量建模和成对似然框架内分析和推断社会调查数据的方法
  • 批准号:
    ES/L009838/1
  • 财政年份:
    2014
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了