基于高通量RNA-seq数据转录组拼接的关键技术与算法研究

批准号:
61432010
项目类别:
重点项目
资助金额:
280.0 万元
负责人:
李国君
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2019
批准年份:
2014
项目状态:
已结题
项目参与者:
高琳、栾贻会、刘丙强、覃桂敏、吴吉昌、贾松卫、柳军涛、Russell Luther Malmberg、Xiuzhen Huang
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关,因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题,利用图论技术将问题模型化,进而将转录组拼接归结为经典的组合最优化问题;通过系统研究相关理论问题,针对海量数据的特征、可变剪接带来的障碍,设计高效准确的算法,解决拼接问题的计算瓶颈;在准确预测转录组的基础上,将算法应用于癌症相关的RNA-seq数据,结合传统的基于基因表达芯片的研究,筛选与特定癌症紧密相关的特定基因,并利用信号传导通路和代谢通路信息进行综合分析,寻找致病基因在转录体水平上差异表达的原因,更加深入的揭示癌症的发生规律和进化机理。
英文摘要
The complex diseases such as cancer are in close relation to alternative splicing in the process of transcription, thus the identification of types, specificity and the expression level of transcription products is especially important to cancer mechanism research and clinical diagnosis. High-throughput RNA-seq technology has provided an unprecedented opportunity to reveal the very complex structures of a eukaryote’s transcriptomic landscape. However, it represents a highly challenging task to accurately and efficiently assemble the huge amount of short RNA-seq reads into transcriptome with alternative transcripts. To solve these key computing problems described above, our project will develop a new assembly technology, which combines the interval graph model and converts the assembly problems into combinatorial optimization problems. Focusing on the characteristics of high throughput sequencing data and the algorithmic obstacles caused by alternative splicing, we will develop a new algorithm to greatly increase the accuracy, reduce the time and space complexity, thus overcoming the deficiency of current assembly algorithms. The new algorithm will be applied to predict transcriptomes for RNA-seq data from specific cancer tissues. The difference analysis on transcriptomes, combining with traditional microarray study, will benefit the prediction of oncogenes. In addition, the existed cancer related signaling pathways and metabolic pathways will be involved to analyze the differential expression at transcription level, aiming at exploring the essential mechanism of cancer development.
研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关,因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题,利用图论技术将问题模型化,进而将转录组拼接归结为经典的组合最优化问题;通过系统研究相关理论问题,针对海量数据的特征、可变剪接带来的障碍,设计高效准确的算法,解决拼接问题的计算瓶颈;在准确预测转录组的基础上,将算法应用于癌症相关的 RNA-seq 数据,结合传统的基于基因表达芯片的研究,筛选与特定癌症紧密相关的特定基因,并利用信号传导通路和代谢通路信息进行综合分析,寻找致病基因在转录体水平上差异表达的原因,更加深入的揭示癌症的发生规律和进化机理。本项目突破了几个经典的转录组拼接算法的计算瓶颈,发表高质量的学术论文70余篇,并研发了相应的算法软件和网络服务平台。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Integrative enrichment analysis: a new computational method to detect dysregulated pathways in heterogeneous samples.
综合富集分析:一种检测异质样本中失调途径的新计算方法
DOI:10.1186/s12864-015-2188-7
发表时间:2015-11-10
期刊:BMC genomics
影响因子:4.4
作者:Yu X;Zeng T;Li G
通讯作者:Li G
Integrating phenotypic feature and tissue-specificnetworks to prioritize disease genes.
整合表型特征和组织特异性网络来确定疾病基因的优先顺序。
DOI:--
发表时间:2016
期刊:Science China-Information Science
影响因子:--
作者:Yue Deng;Lin Gao
通讯作者:Lin Gao
Identifying Cancer Specific Driver Modules Using a Network-Based Method.
使用基于网络的方法识别癌症特异性驱动模块
DOI:10.3390/molecules23051114
发表时间:2018-05-08
期刊:Molecules (Basel, Switzerland)
影响因子:--
作者:Li F;Gao L;Wang P;Hu Y
通讯作者:Hu Y
An integrative and applicable phylogenetic footprinting framework for cis-regulatory motifs identification in prokaryotic genomes.
用于原核基因组中顺式调控基序识别的综合且适用的系统发育足迹框架
DOI:10.1186/s12864-016-2982-x
发表时间:2016-08-09
期刊:BMC genomics
影响因子:4.4
作者:Liu B;Zhang H;Zhou C;Li G;Fennell A;Wang G;Kang Y;Liu Q;Ma Q
通讯作者:Ma Q
Uncovering Driver DNA Methylation Events in Nonsmoking Early Stage Lung Adenocarcinoma.
揭示非吸烟早期肺腺癌中的驱动 DNA 甲基化事件
DOI:10.1155/2016/2090286
发表时间:2016
期刊:BioMed research international
影响因子:--
作者:Zhang X;Gao L;Liu ZP;Jia S;Chen L
通讯作者:Chen L
基于图与组合优化的生物数据和网络数据挖掘算法研究
- 批准号:--
- 项目类别:重点项目
- 资助金额:270万元
- 批准年份:2019
- 负责人:李国君
- 依托单位:
基于de bruijn graph梳理的宏基因组拼接算法开发
- 批准号:61771009
- 项目类别:面上项目
- 资助金额:50.0万元
- 批准年份:2017
- 负责人:李国君
- 依托单位:
癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计
- 批准号:31571354
- 项目类别:面上项目
- 资助金额:25.0万元
- 批准年份:2015
- 负责人:李国君
- 依托单位:
仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究
- 批准号:61272016
- 项目类别:面上项目
- 资助金额:60.0万元
- 批准年份:2012
- 负责人:李国君
- 依托单位:
原核生物转录因子结合位点的算法预测及应用
- 批准号:61070095
- 项目类别:面上项目
- 资助金额:38.0万元
- 批准年份:2010
- 负责人:李国君
- 依托单位:
基于串线的3-维蛋白结构预测的新技术研究
- 批准号:60873207
- 项目类别:面上项目
- 资助金额:35.0万元
- 批准年份:2008
- 负责人:李国君
- 依托单位:
DNA数据挖掘中的组合理论与算法设计
- 批准号:60673059
- 项目类别:面上项目
- 资助金额:27.0万元
- 批准年份:2006
- 负责人:李国君
- 依托单位:
近似算法的设计与分析
- 批准号:60373025
- 项目类别:面上项目
- 资助金额:18.0万元
- 批准年份:2003
- 负责人:李国君
- 依托单位:
图论与组合技术在理论计算机科学中的应用
- 批准号:10271065
- 项目类别:面上项目
- 资助金额:10.5万元
- 批准年份:2002
- 负责人:李国君
- 依托单位:
图的连通因子与正交因子分解问题及其算法研究
- 批准号:19971053
- 项目类别:面上项目
- 资助金额:8.0万元
- 批准年份:1999
- 负责人:李国君
- 依托单位:
国内基金
海外基金
