Informatics platform for mammalian gene regulation at isoform-level

异构体水平的哺乳动物基因调控信息学平台

基本信息

  • 批准号:
    8658144
  • 负责人:
  • 金额:
    $ 33.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-05-02 至 2016-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): In recent years, the notion of "one gene makes one protein that functions in one signaling pathway" in mammalian cells has been shown to be overly simplistic. Recent evidence suggests that more than 50% of the human genes produce multiple protein isoforms, through alternative splicing and alternative usage of transcription initiation and/or termination. Notably, the disruption of many of these genes is implicated in cancer and several neuropsychiatric disorders. For majority of human genes the resulting multiple protein isoforms are functionally different and can participate in different signaling pathways. However, nearly after a decade since the completion of the human genome draft sequence, we still assume "gene" as the basic functional unit in a cell. We argue that the isoform-level gene products - "transcript variants" and "protein isoforms" are the basic functional units in a mammalian cell, and accordingly, the informatics resources for managing and analyzing gene regulation data in mammalian cells should adopt "gene isoform centric" rather than "gene centric" approaches. We propose to build an informatics platform for understanding gene regulation at isoform-level by developing statistically rigorous bioinformatics resources for processing Next-Generation Sequencing (NGS) data. Recently, computational approaches that combine seemingly disparate experimental data have been successful in developing concise gene regulation models and transcriptional modules. We plan to extend these methodologies to perform integrative analysis of multiple high-throughput data sets currently generated across different laboratories, including ours at Wistar, into computational models to predict different transcriptional isoforms of mammalian genes and protein-DNA interactions at isoform level. We will apply innovative statistical modeling approaches that combine state-of-the-art meta-classification algorithms, such as Na¿ve Bayes Tree, Bagging and LogitBoost, with Random Forest feature selection to classify different types of target promoters with good classification accuracy and reduced instability, in order to predict gene promoters and infer the protein-DNA interactions from ChIP-seq data. The computational models and the derived information will be integrated into a novel database, which will serve as an in silico platform for transcriptional regulation studies. This will be completed by pursuing the following aims, (1) Develop statistically rigorous novel algorithms and bioinformatics pipelines to identify the orthologous promoters, corresponding transcript variants and protein isoforms that are conserved between human and mouse, (2) develop novel algorithms and informatics pipelines for integrative analysis of NGS datasets to estimate the activity and expression of both known and novel promoters and their transcript variants, in various tissues, developmental stages, and disease conditions, and (3) develop a web-accessible database for integrating the information generated. The novel bioinformatics methods developed by this project will help in silico discovery and research for accelerating the linkage of phenotypic and genomic information, at gene-isoform level.
描述(由适用提供):近年来,哺乳动物细胞中的“一种基因产生一种在一个信号通路中起作用的蛋白质”的概念已被证明过于简单化。最近的证据表明,通过替代剪接和转录起始和/或终止,超过50%的人基因产生了多种蛋白质同工型。值得注意的是,许多这些基因的破坏在癌症和几种神经精神疾病中实施。对于大多数人类基因,产生的多种蛋白质同工型在功能上不同,并且可以参与不同的信号通路。然而,自人类基因组绘制序列完成以来几乎十年后,我们仍然假设“基因”是细胞中的基本功能单元。我们认为同工型级基因产物 - “转录物变体”和“蛋白质同工型”是基本功能 哺乳动物细胞中的单元,因此,哺乳动物细胞中管理和分析基因调节数据的信息资源应采用“以基因同工型为中心”而不是“以基因为中心”的方法。我们建议通过开发用于处理下一代测序(NGS)数据的统计严格的生物信息学资源来构建一个信息的平台,以了解同工型级别的基因调节。最近,结合了看似不同的实验数据的计算方法已成功地开发了简洁的基因调节模型和转录模块。我们计划将这些方法扩展到当前跨不同实验室(包括我们在Wistar的不同实验室)生成的多个高通量数据集的集成分析,以预测哺乳动物基因的不同转录同工型和在同工型水平上的蛋白质-DNA相互作用。我们将采用创新的统计建模方法,结合了最先进的元分类算法,例如NaâVeVe Ve Bayes Tree,Bagging和LogitBoost,以及随机的森林功能选择,以良好的分类准确性和降低的目标启动子来对不同类型的目标启动子进行分类,以预测基因启动子并从Chip-Seq-seq数据中推断蛋白质DNA相互作用。计算模型和派生信息将集成到新的数据库中,该数据库将作为转录调节研究的计算机平台。 (1)(1)开发统计上严格的新颖算法和生物信息学管道,以识别直系同源的启动子,相应的转录物变体和蛋白质同工型,这些变体和蛋白质同工型是人类和小鼠之间的(2)开发新型算法和信息启动的启动者,以及对NGS进行启动的启动,以估算NGS的促进型,以估算NGS的分析,以估算NGS的分析,以估算NGS的分析,以估算NGS的分析,以估算NGS的分析,以估算NGS的估算值和图表。在各种时机,发育阶段和疾病状况中的变体以及(3)开发一个可访问的数据库,以整合生成的信息。该项目开发的新型生物信息学方法将有助于在基因 - 异型型水平上加速表型和基因组信息的链接,从而有助于硅化和研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

RAMANA V DAVULURI其他文献

RAMANA V DAVULURI的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('RAMANA V DAVULURI', 18)}}的其他基金

Developing novel deep-learning based methods for deciphering non-coding gene regulatory code
开发基于深度学习的新型方法来破译非编码基因调控密码
  • 批准号:
    10451673
  • 财政年份:
    2021
  • 资助金额:
    $ 33.72万
  • 项目类别:
Developing novel deep-learning based methods for deciphering non-coding gene regulatory code
开发基于深度学习的新型方法来破译非编码基因调控密码
  • 批准号:
    10615784
  • 财政年份:
    2021
  • 资助金额:
    $ 33.72万
  • 项目类别:
Informatics Platform for Mammalian Gene Regulation at Isoform-level
异构体水平的哺乳动物基因调控信息学平台
  • 批准号:
    10273985
  • 财政年份:
    2020
  • 资助金额:
    $ 33.72万
  • 项目类别:
Informatics Platform for Mammalian Gene Regulation at Isoform-level
异构体水平的哺乳动物基因调控信息学平台
  • 批准号:
    9922347
  • 财政年份:
    2013
  • 资助金额:
    $ 33.72万
  • 项目类别:
Informatics Platform for Mammalian Gene Regulation at Isoform-level
异构体水平的哺乳动物基因调控信息学平台
  • 批准号:
    8843951
  • 财政年份:
    2013
  • 资助金额:
    $ 33.72万
  • 项目类别:
Bioinformatics Facility
生物信息学设施
  • 批准号:
    7945001
  • 财政年份:
    2009
  • 资助金额:
    $ 33.72万
  • 项目类别:
Genomewide discovery & analysis of alternative promoters
全基因组发现
  • 批准号:
    7678211
  • 财政年份:
    2006
  • 资助金额:
    $ 33.72万
  • 项目类别:
Genomewide discovery & analysis of alternative promoters
全基因组发现
  • 批准号:
    7226994
  • 财政年份:
    2006
  • 资助金额:
    $ 33.72万
  • 项目类别:
Genomewide discovery & analysis of alternative promoters
全基因组发现
  • 批准号:
    7371108
  • 财政年份:
    2006
  • 资助金额:
    $ 33.72万
  • 项目类别:
Genomewide discovery & analysis of alternative promoters
全基因组发现
  • 批准号:
    7033451
  • 财政年份:
    2006
  • 资助金额:
    $ 33.72万
  • 项目类别:

相似国自然基金

无线供能边缘网络中基于信息年龄的能量与数据协同调度算法研究
  • 批准号:
    62372118
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
NURBS参数化的自交理论与算法研究
  • 批准号:
    12301490
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于先进算法和行为分析的江南传统村落微气候的评价方法、影响机理及优化策略研究
  • 批准号:
    52378011
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
分组密码算法后门的研究
  • 批准号:
    62302293
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
时序深度可加网络的算法与学习理论研究
  • 批准号:
    62306338
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Computational tools and resources to study alternative splicing and mRNA isoform variation
研究选择性剪接和 mRNA 亚型变异的计算工具和资源
  • 批准号:
    10669330
  • 财政年份:
    2022
  • 资助金额:
    $ 33.72万
  • 项目类别:
Methods for improving clinical diagnostic by detection, prediction, interpretation and prioritization of aberrant transcriptome variations
通过异常转录组变异的检测、预测、解释和优先排序来改进临床诊断的方法
  • 批准号:
    10674723
  • 财政年份:
    2020
  • 资助金额:
    $ 33.72万
  • 项目类别:
Methods for improving clinical diagnostic by detection, prediction, interpretation and prioritization of aberrant transcriptome variations
通过异常转录组变异的检测、预测、解释和优先排序来改进临床诊断的方法
  • 批准号:
    10451556
  • 财政年份:
    2020
  • 资助金额:
    $ 33.72万
  • 项目类别:
Methods for improving clinical diagnostic by detection, prediction, interpretation and prioritization of aberrant transcriptome variations
通过异常转录组变异的检测、预测、解释和优先排序来改进临床诊断的方法
  • 批准号:
    10033447
  • 财政年份:
    2020
  • 资助金额:
    $ 33.72万
  • 项目类别:
Informatics Platform for Mammalian Gene Regulation at Isoform-level
异构体水平的哺乳动物基因调控信息学平台
  • 批准号:
    10273985
  • 财政年份:
    2020
  • 资助金额:
    $ 33.72万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了