癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

批准号:
31571354
项目类别:
面上项目
资助金额:
25.0 万元
负责人:
李国君
依托单位:
学科分类:
C0608.生物数据资源与分析方法
结题年份:
2017
批准年份:
2015
项目状态:
已结题
项目参与者:
高勃、柳军涛、李阳、齐恩凤、王振佳、穆增超、于祥田、江素云、于婷
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
新一代测序技术使得我们可用计算机在众多癌症患者中预测那些与癌症发生发展密切相关的体细胞突变,称驱动突变。然而,更多的体细胞突变与癌症的发生发展没有关系,这类体细胞突变被称为随机突变。我们面临的挑战问题是:如何从随机突变中通过高性能计算识别与癌症密切相关的驱动突变?预测驱动突变的常规方法是寻找在大量癌症基因组中突变频繁的基因。人们发现驱动突变会同时干扰多个信号通路,这对上述常规方法提出了严峻的挑战。所以,每个癌症患者可能会有不同的突变组合都足以干扰这些信号通路。这种突变的异质性对传统上仅从突变发生的频率预测其驱动突变提出了疑问。我们将利用覆盖率和互斥性这两个组合性质来研究识别驱动信号通路的方法。本项目研究癌症患者体细胞突变的内在机制,探索其理论问题,设计快速有效的算法及软件预测体细胞突变数据中的驱动突变及驱动突变信号通路,并运用我们的算法和软件对各类癌症患者的体细胞突变数据进行分析。
英文摘要
Next-generation DNA sequencing technologies are enabling genome-wide discovery of somatic mutations which are highly related to cancer development that are called driver mutations. However, most mutations involved in sequencing data are not related to cancer at all that are called passenger mutations. Therefore, the major challenging problem we have to face is to distinguish those functional ‘‘driver mutations’’ important for cancer development from random ‘‘passenger mutations’’.A common approach for identifying driver mutations is to find genes that are mutated at significant frequency in a large cohort of cancer genomes. This approach is confounded by the observation that driver mutations target multiple cellular signaling and regulatory pathways. Thus, each cancer patient may exhibit a different combination of mutations that are sufficient to perturb these pathways. This mutational heterogeneity presents a problem for predicting driver mutations solely from their frequency of occurrence. We employ two combinatorial properties, coverage and exclusivity, to distinguish driver pathways, or groups of genes containing driver mutations, from groups of genes with passenger mutations. In this project, we will develop an effective and efficient algorithm with its implementation to find driver pathways from somatic mutation data. We then apply our algorithm to analyze somatic mutation data from genes in lung adenocarcinoma patients, genes in glioblastoma patients, and known mutations in patients with various cancers.
研究背景:新一代 DNA 测序技术使得我们可用计算机在众多癌症患者中预测那些与癌症发生发展密切相关的体细胞突变,称驱动突变(driver mutations)。然而,更多的体细胞突变与癌症的发生发展没有关系,这类体细胞突变被称为随机突变(passenger mutations)。预测驱动突变的常规方法是寻找在大量癌症基因组中突变频繁的基因。人们发现驱动突变会同时扰动多个信号通路,这对上述常规方法提出了严峻的挑战。所以,每个癌症患者可能会有不同的突变组合都足以扰动这些信号通路。这种突变的异质性对传统上仅从突变发生的频率预测其驱动突变提出了疑问。因此,如何利用 DNA 测序数据从随机突变基因中辨认出驱动突变基因是癌症生物信息学研究领域中的重大难题之一。. 研究内容:基于基因突变数据和各类生物网络数据,研究从随机突变基因中识别与癌症密切相关的驱动突变基因的高性能计算方法,并开发相应的算法实现软件。. 主要结果:我们利用覆盖率和互斥性这两个组合性质来研究了从正常信号通路识别驱动信号通路的方法,提出一个基于网络的预测算法,命名为 CovEx。 撰写的文章发表在肿瘤研究领域的核心期刊 “Oncotarget” 上。 . 关键数据及科学意义:把 CovEx 应用于来之 TCGA 的含有12 个癌症类型的泛癌症数据,其预测结果说明我们的算法 CovEx 从各个方面远优于目前的同类算法。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
An integrative and applicable phylogenetic footprinting framework for cis-regulatory motifs identification in prokaryotic genomes.
用于原核基因组中顺式调控基序识别的综合且适用的系统发育足迹框架
DOI:10.1186/s12864-016-2982-x
发表时间:2016-08-09
期刊:BMC genomics
影响因子:4.4
作者:Liu B;Zhang H;Zhou C;Li G;Fennell A;Wang G;Kang Y;Liu Q;Ma Q
通讯作者:Ma Q
Bacterial regulon modeling and prediction based on systematic cis regulatory motif analyses.
基于系统顺式调节基序分析的细菌调节子建模和预测
DOI:10.1038/srep23030
发表时间:2016-03-15
期刊:Scientific reports
影响因子:4.6
作者:Liu B;Zhou C;Li G;Zhang H;Zeng E;Liu Q;Ma Q
通讯作者:Ma Q
UniBic: Sequential row-based biclustering algorithm for analysis of gene expression data.
UniBic:用于分析基因表达数据的基于顺序行的双聚类算法
DOI:10.1038/srep23466
发表时间:2016-03-22
期刊:Scientific reports
影响因子:4.6
作者:Wang Z;Li G;Robinson RW;Huang X
通讯作者:Huang X
Identification of driver modules in pan-cancer via coordinating coverage and exclusivity
通过协调覆盖范围和排他性识别泛癌中的驱动模块
DOI:10.18632/oncotarget.16433
发表时间:2017-05-30
期刊:ONCOTARGET
影响因子:--
作者:Gao, Bo;Li, Guojun;Huang, Xiuzhen
通讯作者:Huang, Xiuzhen
BinPacker: Packing-Based De Novo Transcriptome Assembly from RNA-seq Data.
BinPacker:基于 RNA-seq 数据的包装 De Novo 转录组组装
DOI:10.1371/journal.pcbi.1004772
发表时间:2016-02
期刊:PLoS computational biology
影响因子:4.3
作者:Liu J;Li G;Chang Z;Yu T;Liu B;McMullen R;Chen P;Huang X
通讯作者:Huang X
基于图与组合优化的生物数据和网络数据挖掘算法研究
- 批准号:--
- 项目类别:重点项目
- 资助金额:270万元
- 批准年份:2019
- 负责人:李国君
- 依托单位:
基于de bruijn graph梳理的宏基因组拼接算法开发
- 批准号:61771009
- 项目类别:面上项目
- 资助金额:50.0万元
- 批准年份:2017
- 负责人:李国君
- 依托单位:
基于高通量RNA-seq数据转录组拼接的关键技术与算法研究
- 批准号:61432010
- 项目类别:重点项目
- 资助金额:280.0万元
- 批准年份:2014
- 负责人:李国君
- 依托单位:
仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究
- 批准号:61272016
- 项目类别:面上项目
- 资助金额:60.0万元
- 批准年份:2012
- 负责人:李国君
- 依托单位:
原核生物转录因子结合位点的算法预测及应用
- 批准号:61070095
- 项目类别:面上项目
- 资助金额:38.0万元
- 批准年份:2010
- 负责人:李国君
- 依托单位:
基于串线的3-维蛋白结构预测的新技术研究
- 批准号:60873207
- 项目类别:面上项目
- 资助金额:35.0万元
- 批准年份:2008
- 负责人:李国君
- 依托单位:
DNA数据挖掘中的组合理论与算法设计
- 批准号:60673059
- 项目类别:面上项目
- 资助金额:27.0万元
- 批准年份:2006
- 负责人:李国君
- 依托单位:
近似算法的设计与分析
- 批准号:60373025
- 项目类别:面上项目
- 资助金额:18.0万元
- 批准年份:2003
- 负责人:李国君
- 依托单位:
图论与组合技术在理论计算机科学中的应用
- 批准号:10271065
- 项目类别:面上项目
- 资助金额:10.5万元
- 批准年份:2002
- 负责人:李国君
- 依托单位:
图的连通因子与正交因子分解问题及其算法研究
- 批准号:19971053
- 项目类别:面上项目
- 资助金额:8.0万元
- 批准年份:1999
- 负责人:李国君
- 依托单位:
国内基金
海外基金
