仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究

批准号:
61272016
项目类别:
面上项目
资助金额:
60.0 万元
负责人:
李国君
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2016
批准年份:
2012
项目状态:
已结题
项目参与者:
刘丙强、薛兵、于祥田、周川、常征、王振佳、孙剑阳、袁晓辰、李阳
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
可变剪接是指从一个前体mRNA中通过不同的剪接方式产生不同的成熟mRNA的过程。可变剪接是调控基因表达和产生蛋白质组多样性的重要机制。在人类基因组中,大约95% 的多外显子基因中存在可变剪接。基因的异常剪接与疾病有着密切的关系;人类相当一部分疾病包括癌症被认为起因于基因的可变剪接。高通量cDNA 测序技术使得可变剪接转录组的计算预测成为可能。近两年,NATURE系列期刊上连续刊出数篇有关基于RNA-Seq数据计算预测可变剪接转录组的科技文章和软件,使得可变剪接转录组的计算预测成为国际生物信息学研究领域最具挑战的研究课题之一。最近我们发现:基因的外显子以及它们在基因中的线性顺序完全可以通过拼装RNA-Seq数据预测出来。这就意味着可变剪接转录组的计算预测不需要参考基因组序列,我们将由此设计一个高效可靠的计算预测可变剪接转录组的算法和软件,使该问题的计算预测推向一个全新的高度。
英文摘要
Alternative splicing is a process by which the exons of the RNA produced by transcription of a gene are reconnected in multiple ways during RNA splicing. The resulting different mRNAs may be translated into different protein isoforms. Alternative splicing occurs as a normal phenomenon in eukaryotes, where it greatly increases the biodiversity of proteins that can be encoded by the genome. Thus, it is an important mechanism for gene regulation expression. In humans, about 95% of multiexonic genes are alternatively spliced. Mechanisms of alternative splicing are highly variable, and new examples are constantly being found, particularly through the use of high-throughput techniques. Researchers hope to fully elucidate the regulatory systems involved in splicing, so that alternative splicing products from a given gene under particular conditions could be predicted by a splicing code. Abnormal variations in splicing are also implicated in disease; a large proportion of human genetic disorders result from splicing variants. Abnormal splicing variants are also thought to contribute to the development of cancer. High throughput cDNA sequencing technologies make it possible to predict spliced transcripts computationally. A couple of articles regarding computational prediction of spliced transcripts have already been published in Nature series, implying that this topic has become one of the most challenging problems. Very recently, we made a discovery that exons and their linear order encoded in a gene can be precisely predicted solely by assembling RNA-Seq data. This discovery implies that spliced transcripts can be computationally predicted without a reference genome. In this project we are going to develop a new diagram for de novo prediction of spliced transcripts.
随着生物测序数据潮水般的涌现,转录组重构的拼接算法研究是当今生物信息学领域最具挑战研究课题之一。项目团队在该领域开展了深入的研究,在转录组重构的拼接算法方面取得了实质性的进展,相继设计开发了三套转录组重构的算法和软件,其性能均比目前国际上最流行的同类算法提高了大约 20%,被数家学术媒体跟踪报道。其中两个软件Bridger和TransComb的文章发在Genome Biology(IF:11.313;生物类一区),另一个软件BinPacker的文章发在Plos Computational Biology(IF:4.587;生物计算类一区)。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
BinPacker: Packing-Based De Novo Transcriptome Assembly from RNA-seq Data.
BinPacker:基于 RNA-seq 数据的包装 De Novo 转录组组装
DOI:10.1371/journal.pcbi.1004772
发表时间:2016-02
期刊:PLoS computational biology
影响因子:4.3
作者:Liu J;Li G;Chang Z;Yu T;Liu B;McMullen R;Chen P;Huang X
通讯作者:Huang X
A New Algorithm for Detecting Coevolving Amino AcidSites in Proteins
检测蛋白质中共进化氨基酸位点的新算法
DOI:--
发表时间:2014
期刊:Plos One
影响因子:3.7
作者:J. Sun;L. Wang;G. Li;B. Liu
通讯作者:B. Liu
Integrative enrichment analysis: a new computational method to detect dysregulated pathways in heterogeneous samples.
综合富集分析:一种检测异质样本中失调途径的新计算方法
DOI:10.1186/s12864-015-2188-7
发表时间:2015-11-10
期刊:BMC genomics
影响因子:4.4
作者:Yu X;Zeng T;Li G
通讯作者:Li G
An integrative and applicable phylogenetic footprinting framework for cis-regulatory motifs identification in prokaryotic genomes.
用于原核基因组中顺式调控基序识别的综合且适用的系统发育足迹框架
DOI:10.1186/s12864-016-2982-x
发表时间:2016-08-09
期刊:BMC genomics
影响因子:4.4
作者:Liu B;Zhang H;Zhou C;Li G;Fennell A;Wang G;Kang Y;Liu Q;Ma Q
通讯作者:Ma Q
Bacterial regulon modeling and prediction based on systematic cis regulatory motif analyses.
基于系统顺式调节基序分析的细菌调节子建模和预测
DOI:10.1038/srep23030
发表时间:2016-03-15
期刊:Scientific reports
影响因子:4.6
作者:Liu B;Zhou C;Li G;Zhang H;Zeng E;Liu Q;Ma Q
通讯作者:Ma Q
基于图与组合优化的生物数据和网络数据挖掘算法研究
- 批准号:--
- 项目类别:重点项目
- 资助金额:270万元
- 批准年份:2019
- 负责人:李国君
- 依托单位:
基于de bruijn graph梳理的宏基因组拼接算法开发
- 批准号:61771009
- 项目类别:面上项目
- 资助金额:50.0万元
- 批准年份:2017
- 负责人:李国君
- 依托单位:
癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计
- 批准号:31571354
- 项目类别:面上项目
- 资助金额:25.0万元
- 批准年份:2015
- 负责人:李国君
- 依托单位:
基于高通量RNA-seq数据转录组拼接的关键技术与算法研究
- 批准号:61432010
- 项目类别:重点项目
- 资助金额:280.0万元
- 批准年份:2014
- 负责人:李国君
- 依托单位:
原核生物转录因子结合位点的算法预测及应用
- 批准号:61070095
- 项目类别:面上项目
- 资助金额:38.0万元
- 批准年份:2010
- 负责人:李国君
- 依托单位:
基于串线的3-维蛋白结构预测的新技术研究
- 批准号:60873207
- 项目类别:面上项目
- 资助金额:35.0万元
- 批准年份:2008
- 负责人:李国君
- 依托单位:
DNA数据挖掘中的组合理论与算法设计
- 批准号:60673059
- 项目类别:面上项目
- 资助金额:27.0万元
- 批准年份:2006
- 负责人:李国君
- 依托单位:
近似算法的设计与分析
- 批准号:60373025
- 项目类别:面上项目
- 资助金额:18.0万元
- 批准年份:2003
- 负责人:李国君
- 依托单位:
图论与组合技术在理论计算机科学中的应用
- 批准号:10271065
- 项目类别:面上项目
- 资助金额:10.5万元
- 批准年份:2002
- 负责人:李国君
- 依托单位:
图的连通因子与正交因子分解问题及其算法研究
- 批准号:19971053
- 项目类别:面上项目
- 资助金额:8.0万元
- 批准年份:1999
- 负责人:李国君
- 依托单位:
国内基金
海外基金
