Predicting 3D physical gene-enhancer interactions through integration of GTEx and 4DN data
通过整合 GTEx 和 4DN 数据预测 3D 物理基因增强子相互作用
基本信息
- 批准号:10776871
- 负责人:
- 金额:$ 29.82万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-20 至 2024-09-19
- 项目状态:已结题
- 来源:
- 关键词:3-DimensionalATAC-seqAddressAffectAlgorithmsBiological AssayCRISPR interferenceCellsChIP-seqChromatinChromatin ModelingChromosomesComputer AnalysisDNADNase I hypersensitive sites sequencingDataDatabasesElementsEnhancersEpigenetic ProcessFrequenciesFundingGene ExpressionGene Expression RegulationGene TargetingGenesGenomeGenomicsGenotypeGenotype-Tissue Expression ProjectHealthHi-CHumanInvestigationLinkLocationMachine LearningMapsMethodsModelingMolecular ConformationPolymersPrincipal InvestigatorQuantitative Trait LociRegulatory ElementResourcesStructureTechniquesTestingTissuesTrainingTrustUntranslated RNAValidationVariantcausal variantcell typechromosome conformation capturecomputerized toolscostdata integrationdata resourcedata standardsdeep learningdeep learning modelepigenomicsgene interactiongenetic variantgenome sequencinggenome wide association studygenome-widegenome-wide analysishistone modificationimprovedinnovationinsightlarge scale simulationmachine learning predictionprogramsrisk variantsimulationtooltranscriptome sequencingtrustworthinesswhole genome
项目摘要
Program Director/Principal Investigator (Liang, Jie):
PROJECT SUMMARY/ABSTRACT
We will develop computational tools that facilitate investigation of the fundamental relationship
between gene expression and genome topology. Specifically, we will develop machine learning tools
that can link enhancer and its targeted gene at genome wide scale. The ability of establishing
relationship between enhancers and their target genes is critically important, as it will aid in our
understanding of gene regulation and in establishing the relationship between noncoding risk variants
from GWAS studies to potential causal genes. Our approach will be based on 3D polymer models of
chromatin interactions derived from Hi-C data in the common fund 4D Nucleome (4DN) database,
and will integrate data from the common fund supported Genotype-Tissue Expression (GTEx)
databaseas, as well as data from ENCODE database. We will 1) construct a database of trusted high-
quality database of candidate enhancer-gene target pairs. We will then 2) use this database to train a
machine learning predictor that can predict enhancer-gene target pairs at genome wide scale. For 1),
we will develop a pipeline to identify a small set of critical specific chromatin 3D interactions through
simulation of large scale folding of 3D chromatin ensembles. The small set of specific interactions will
be tested for sufficiency of chromatin folding. We will then identify computationally enhancers based
on epigenetic histone modifications and chromatin accessibility data from ENCODE as well as the
Roadmap Epigenomics Project. We will then select enhancers containing eQTLs from the GTEx
databases, which are known to affect the expression of the target gene. The end result will be a high-
quality and trustworthy database of enhance-gene pairs, which will be provided by the predicted
critical specific 3D physical chromatin interactions connecting the eQTL-containing enhancer and the
target gene. For 2), we will develop a machine-learning predictor that predicts enhancer-gene
interactions from genomic, epigenomic, and Hi-C data at genome-wide scale. We will combine
epigenetic data with genomic information (such as sequence motifs of TFs) as features. We will then
train a machine learning predictor through hold-outs and cross-validations of the constructed
database of enhancer-target gene pairs from 1). The efficacy of the predictor will then be assessed
with the gold-standard of the CRISPRi-FlowFISH data. We will then carry out large scale
computational and will construct databases of predicted enhancer-gene relationship for selected cell
types. Overall, we will demonstrate significant added-power of integrating two important Common
Fund data resources and will provide tools to facilitate understanding the relationship between
genome topology and gene expression. Our computational tools will lead to new insight into the
relationship of genome structure and genome function important for improving human health.
0925-0001 (Rev. 03/16) Page Continuation Format Page
项目负责人/主要研究者(梁杰):
项目摘要/摘要
我们将开发计算工具,促进调查的基本关系,
基因表达和基因组拓扑之间的联系具体来说,我们将开发机器学习工具
可以在全基因组范围内连接增强子和其靶基因。建立能力
增强子和它们的靶基因之间的关系是至关重要的,因为它将有助于我们
了解基因调控和建立非编码风险变异之间的关系
从GWAS研究到潜在的致病基因。我们的方法将基于3D聚合物模型,
来自共同基金4D Nucleome(4DN)数据库中Hi-C数据的染色质相互作用,
并将整合来自共同基金支持的基因型-组织表达(GTEx)的数据
数据库以及ENCODE数据库中的数据。我们将1)建立一个可信度高的数据库-
候选增强子-基因靶对的质量数据库。然后,我们将使用这个数据库来训练一个
机器学习预测器,可以在全基因组范围内预测增强子-基因靶对。对于1),
我们将开发一个管道,通过以下方式识别一小组关键的特异性染色质3D相互作用:
3D染色质系综的大规模折叠模拟。一小部分特定的相互作用将
检测染色质折叠的充分性。然后,我们将确定计算增强剂的基础上,
关于表观遗传组蛋白修饰和来自ENCODE的染色质可及性数据以及
路线图表观基因组学项目。然后,我们将从GTEx中选择含有eQTL的增强子,
数据库,已知其影响靶基因的表达。最终结果将是一个高-
高质量和可靠的增强基因对数据库,这将由预测的
关键的特异性3D物理染色质相互作用,连接含eQTL的增强子和
靶基因对于2),我们将开发一个机器学习预测器,预测增强子基因
从基因组,表观基因组和Hi-C数据在全基因组范围内的相互作用。我们将联合收割机
以基因组信息(例如TF的序列基序)作为特征的表观遗传数据。然后我们将
通过对所构建的模型的保留和交叉验证来训练机器学习预测器,
来自1)的增强子-靶基因对的数据库。然后将评估预测因子的有效性
CRISPRi-FlowFISH数据的黄金标准。我们将进行大规模的
计算并将构建所选细胞的预测增强子-基因关系的数据库
类型总的来说,我们将展示整合两个重要的通用
基金的数据资源,并将提供工具,以促进了解之间的关系,
基因组拓扑学和基因表达。我们的计算工具将带来对
基因组结构和基因组功能的关系对改善人类健康很重要。
0925-0001(Rev. 03/16)Page Continuation Format Page
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jie Liang其他文献
Jie Liang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jie Liang', 18)}}的其他基金
Constructing High-Resolution Ensemble Models of 3D Single-Cell Chromatin Conformations of eQTL Loci from Integrated Analysis of 4DN-GTEx Data towards Structural Basis of Differential Gene Expression
从 4DN-GTEx 数据的集成分析构建 eQTL 位点 3D 单细胞染色质构象的高分辨率整体模型,以构建差异基因表达的结构基础
- 批准号:
10357063 - 财政年份:2021
- 资助金额:
$ 29.82万 - 项目类别:
Models and Algorithms for Beta-Barrel Membrane Proteins and Stochastic Networks
β-桶膜蛋白和随机网络的模型和算法
- 批准号:
9923024 - 财政年份:2018
- 资助金额:
$ 29.82万 - 项目类别:
Models and Algorithms for Beta-Barrel Membrane Proteins and Stochastic Networks
β-桶膜蛋白和随机网络的模型和算法
- 批准号:
10395949 - 财政年份:2018
- 资助金额:
$ 29.82万 - 项目类别:
Constructing Ensembles of 3D Structures of Igh Locus and Predicting Novel Chromosomal Interactions
构建 Igh 基因座 3D 结构的集合并预测新的染色体相互作用
- 批准号:
9317936 - 财政年份:2017
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
8546506 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
7586266 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
7213136 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
8918774 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
7356031 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
Computational Assembly of Beta Barrel Membrane Protein
β 桶膜蛋白的计算组装
- 批准号:
8034791 - 财政年份:2007
- 资助金额:
$ 29.82万 - 项目类别:
相似国自然基金
基于ATAC-seq与DNA甲基化测序探究染色质可及性对莲两生态型地下茎适应性分化的作用机制
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
利用ATAC-seq联合RNA-seq分析TOP2A介导的HCC肿瘤细胞迁移侵
袭的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向图神经网络ATAC-seq模体识别的最小间隔单细胞聚类研究
- 批准号:62302218
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于ATAC-seq策略挖掘穿心莲基因组中调控穿心莲内酯合成的增强子
- 批准号:
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
基于单细胞ATAC-seq技术的C4光合调控分子机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于ATAC-seq技术研究交叉反应物质197调控TFEB介导的自噬抑制子宫内膜异位症侵袭的分子机制
- 批准号:82001520
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
靶向治疗动态调控肺癌细胞DNA可接近性的ATAC-seq分析
- 批准号:81802809
- 批准年份:2018
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
运用ATAC-seq技术分析染色质可接近性对犏牛初级精母细胞基因表达的调控作用
- 批准号:31802046
- 批准年份:2018
- 资助金额:27.0 万元
- 项目类别:青年科学基金项目
基于ATAC-seq和RNA-seq研究CWIN调控采后番茄果实耐冷性作用机制
- 批准号:31801915
- 批准年份:2018
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
基于ATAC-seq高精度预测染色质相互作用的新方法和基于增强现实的3D基因组数据可视化
- 批准号:31871331
- 批准年份:2018
- 资助金额:59.0 万元
- 项目类别:面上项目
相似海外基金
Project #2 Integrated single-nucleus multi-omics (ATAC-seq+RNA-seq or chromatin accessibility + RNA-seq) of human TGs
项目
- 批准号:
10806548 - 财政年份:2023
- 资助金额:
$ 29.82万 - 项目类别:
A transposase system for integrative ChIP-exo and ATAC-seq analysis at single-cell resolution
用于单细胞分辨率综合 ChIP-exo 和 ATAC-seq 分析的转座酶系统
- 批准号:
10210424 - 财政年份:2018
- 资助金额:
$ 29.82万 - 项目类别:
EAPSI: Developing Single Nucleus ATAC-seq to Map the Ageing Epigenome
EAPSI:开发单核 ATAC-seq 来绘制衰老表观基因组图谱
- 批准号:
1714070 - 财政年份:2017
- 资助金额:
$ 29.82万 - 项目类别:
Fellowship Award
A cloud-based learning module to analyze ATAC-seq and single cell ATAC-seq data
基于云的学习模块,用于分析 ATAC-seq 和单细胞 ATAC-seq 数据
- 批准号:
10558379 - 财政年份:2001
- 资助金额:
$ 29.82万 - 项目类别: