Big Data Methods for Decoding Gene Regulation

解码基因调控的大数据方法

基本信息

  • 批准号:
    9762143
  • 负责人:
  • 金额:
    $ 42.08万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-10 至 2022-05-31
  • 项目状态:
    已结题

项目摘要

Project Summary A comprehensive understanding of how genes' activities are controlled temporally and spatially is crucial for studying human development and diseases. Transcription factors (TFs) are an important class of regulatory proteins that can control genes' transcriptional activities by binding to target genes' regulatory DNA sequences called cis-regulatory elements (CREs). A map of genome-wide activities of CREs, or “regulome”, in all cell types and biological conditions will provide a foundation for investigating the basic operating rules of biology, interpreting how genetic variants cause diseases, and guiding the development of disease treatment strategies. Unfortunately, existing experimental regulome mapping technologies cannot analyze a large number of samples efficiently. Thus far, they have only been applied to map regulomes in a small fraction of all biological contexts. As a result, today a comprehensive map of human regulatory landscape is still lacking. This study aims to develop a solution to mapping regulomes in a massive number of biological samples from diverse cell types and conditions by leveraging publicly available functional genomic data. We will use the rich gene expression and regulome data generated by the Encyclopedia of DNA Elements (ENCODE) project to develop a new prediction approach that predicts a biological sample's regulome using its transcriptome (Aim 1). We will then apply the trained prediction models to 290,000+ publicly available human gene expression samples in the Gene Expression Omnibus (GEO) database to create a regulome map that covers hundreds of thousands more biological contexts than existing regulome data (Aim 2). We will also develop a method to help researchers explore the massive datasets to gain biological insights into gene regulation by projecting the data to their low- dimensional structure reflecting their developmental trajectory (Aim 3). Our research will create new analytical methods for predicting ultra-high-dimensional outcomes using ultra- high-dimensional predictors, making cross-platform predictions when the training and application data are gener- ated by different technological platforms with systematic platform differences, and retrieving the low-dimensional spanning tree structure from a massive dataset. Applying these new methods to the vast amounts of publicly available gene expression data will allow us to address a major challenge in regulome mapping that cannot be solved using existing experimental technologies. By enabling fast and cost-efficient mapping and analysis of human gene regulatory landscape, the proposed research can have a major impact on future studies of human development and diseases.
项目摘要 全面了解基因的活动是如何在时间和空间上受到控制的,对于 研究人类发展和疾病。转录因子是一类重要的调控因子。 通过与靶基因的调控DNA序列结合来控制基因转录活性的蛋白质 称为顺式调节元件(Cres)。所有细胞中Cres或“调节体”的全基因组活动图 类型和生物条件将为研究生物学的基本运行规律提供基础, 解释基因变异如何导致疾病,并指导疾病治疗策略的制定。 遗憾的是,现有的试验性Regulome图谱技术无法分析大量样本 EFfi明显升高。到目前为止,它们只被应用于绘制所有生物学背景中的一小部分调节体。 因此,今天仍然缺乏一张全面的人类监管版图。 这项研究旨在开发一种解决方案,以绘制大量生物样本中的调控组 通过利用公开可用的功能基因组数据,实现不同的细胞类型和条件。我们将利用富人 由DNA元素百科全书(ENCODE)项目生成的基因表达和调节组数据 开发一种新的预测方法,利用生物样品的转录组来预测其调节组(目标1)。 然后,我们将把训练好的预测模型应用于29万多个公开可用的人类基因表达样本 在基因表达总览(GEO)数据库中创建涵盖数十万人的调节组图谱 比现有的调节组数据更多的生物学背景(目标2)。我们还将开发一种方法来帮助研究人员 探索海量数据集,通过将数据投影到其最低层来获得对基因调控的生物学见解- 空间结构反映了它们的发展轨迹(目标3)。 我们的研究将创造新的分析方法,用于预测超高维结果 高维预测器,在培训和应用数据更通用时进行跨平台预测- 由不同的技术平台以系统的平台差异,检索低维的 从海量数据集生成树结构。将这些新方法应用于大量公开的 可用的基因表达数据将使我们能够解决调节组映射中的一个重大挑战,而这一挑战不可能 利用现有的实验技术解决了这个问题。通过实现快速且经济实惠的fi映射和分析 人类基因调控格局,拟议的研究可以对未来人类研究产生重大影响 发展和疾病。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hongkai Ji其他文献

Hongkai Ji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hongkai Ji', 18)}}的其他基金

Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10418079
  • 财政年份:
    2022
  • 资助金额:
    $ 42.08万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10205134
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10443743
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10001077
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    10171879
  • 财政年份:
    2018
  • 资助金额:
    $ 42.08万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8516554
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8372529
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8342445
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8666661
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
  • 项目类别:

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队

相似海外基金

Conference: Theory and Foundations of Statistics in the Era of Big Data
会议:大数据时代的统计学理论与基础
  • 批准号:
    2403813
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Standard Grant
FightAMR: Novel global One Health surveillance approach to fight AMR using Artificial Intelligence and big data mining
FightAMR:利用人工智能和大数据挖掘对抗 AMR 的新型全球统一健康监测方法
  • 批准号:
    MR/Y034422/1
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Research Grant
Exploring Hotel Customer Experiences in Japan via Big Data and Large Language Model Analysis
通过大数据和大语言模型分析探索日本酒店客户体验
  • 批准号:
    24K21025
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CC* Networking Infrastructure: Enabling Big Science and Big Data Projects at the University of Massachusetts
CC* 网络基础设施:支持马萨诸塞大学的大科学和大数据项目
  • 批准号:
    2346286
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Standard Grant
Big Data-based Distributed Control using a Behavioural Systems Framework
使用行为系统框架的基于大数据的分布式控制
  • 批准号:
    DP240100300
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Discovery Projects
REU Site: Online Interdisciplinary Big Data Analytics in Science and Engineering
REU 网站:科学与工程领域的在线跨学科大数据分析
  • 批准号:
    2348755
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Standard Grant
Market Orientation, Big Data Analysis Capability, and Business Performance: The Moderating Role of Supplier Relationship, Big data Analysis Outscoring
市场导向、大数据分析能力与经营绩效:供应商关系的调节作用、大数据分析得分
  • 批准号:
    24K05127
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Generative Visual Pre-training on Unlabelled Big Data
未标记大数据的生成视觉预训练
  • 批准号:
    DP240101848
  • 财政年份:
    2024
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Discovery Projects
MEGASKILLS [MEthodology of Psycho-pedagogical, Big Data and Commercial Video GAmes procedures for the European SKILLS Agenda Implementation]
MEGASKILLS [欧洲技能议程实施的心理教育学、大数据和商业视频游戏程序的方法]
  • 批准号:
    10069843
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
  • 项目类别:
    EU-Funded
Improving NHS perimenopausal diagnosis and HRT prescription through AI, machine learning and big data
通过人工智能、机器学习和大数据改善 NHS 围绝经期诊断和 HRT 处方
  • 批准号:
    10053966
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
  • 项目类别:
    Collaborative R&D
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了