基因组数据分析的基础理论与算法
结题报告
批准号:
61732009
项目类别:
重点项目
资助金额:
260.0 万元
负责人:
朱大铭
依托单位:
学科分类:
F0213.生物信息计算与数字健康
结题年份:
2022
批准年份:
2017
项目状态:
已结题
项目参与者:
吴方向、郭炅、李敏、姜海涛、彭小清、余颖、郭林沅、蒲莲容、杨润民
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
基因组组装是基因组数据分析的基础。结构变异预测和功能区域发现是基因组数据分析的核心,是从基因组结构分析走向功能分析的前提。本项目针对从一维到高维的基因组数据,围绕基因组组装、结构变异预测、功能区域发现等内容开展基因组数据分析基础理论与算法研究。寻找基因组数据质量控制方法,降低噪声对基因组数据分析结果的影响。根据基因组数据分析的计算需求,挖掘表达数据分析质量的特征参量。利用基因组数据特征参量建立组合优化问题模型,面向基因组数据特征,设计基因组数据分析组合优化问题的精确算法、参数算法和近似算法。取得一批在国内外有影响的基础理论成果。设计高效并行算法实现基因组数据分析计算需求。最后,开发具有自主知识产权的生物信息学软件,应用于肺癌等恶性肿瘤的基因组数据分析中。项目实施,在国际基因组数据分析基础理论与算法研究领域取得重大突破,为人类认识肿瘤疾病的发病机理,寻找诊断与治疗肿瘤疾病的手段做出贡献。
英文摘要
Genome assembly is the basis of genome data analysis. Structural variant prediction and functional area finding are crucial in genome data analysis, and the premise for going from genome structure analysis to genome function analysis. The research aims at one dimensional as well as three dimensional genome data, launches to develop foundational theory and algorithms for genome data analysis such as genome assembly, structural variant prediction, functional area finding, et al. In hope of excluding noises in all kinds of genome data, the research start with finding effective methods to control the genome data quality, and then go to mine the genome data characteristics based on the computational requirements of the concrete genome data analysis. Using the genome data characteristics, the research sets to capture combinational problems to account for the computational requirements for genome data analysis, then sets to design exact, parameterized, and approximation algorithms for those problems used to formalize the computational requirements, so that a number of foundational high quality theoretical results on genome data analysis will be achieved. Finally, a bioinformatics software with proprietary intellectual property rights will be developed, and used in cancer genome data analysis. Putting the project into effect, we aim to make breakthroughs in the area of genome data analysis theory and algorithms, and contribute to explore the principles of cancer disease, and find diagnosis and treatment methods of it.
开展了基因组和转录组组装、片段框架构建和填充、基因组重排序、测序数据质量控制、基因组结构变异预测、三维基因组数据分析、蛋白质质谱鉴定、基因调控网络和基因-疾病关联分析等内容的基因组数据分析基础理论与算法研究。设计出基因组重排序算法,正面确定了一个开放20年的组合问题的复杂性;设计出最大内点生成树近似算法,首次阐明了该问题与最大路径覆盖问题解的量化关系;首次提出转录组组装的混合整数线性规划模型,大幅提高了高精度转录本的预测精度;提出预测未知细胞类型或物种的三维基因组中Loop结构的集成机器学习模型,以此发现了小鼠基因组的高度保守Loop结构;构建了一种基于三维基因组数据的Loop预测方法评价体系,建立了支持该体系的金标准数据集。根据基因组重排原理建立了新的基因组重排序问题模型,突破了原有问题模型不能反映真实基因组重排事件的局限性。项目研究成果用于大豆基因组的重复片段和结构差异分析,获得初步成效。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
SCOP: a novel scaffolding algorithm based on contig classification and optimization
SCOP:一种基于重叠群分类和优化的新型支架算法
DOI:10.1093/bioinformatics/bty773
发表时间:2018-09
期刊:Bioinformatics
影响因子:5.8
作者:Min Li;Li Tang;Fang-Xiang Wu;Yi Pan;Jianxin Wang
通讯作者:Jianxin Wang
SVLR: Genome Structural Variant Detection Using Long-Read Sequencing Data
SVLR:使用长读长测序数据进行基因组结构变异检测
DOI:10.1089/cmb.2021.0048
发表时间:2021-05-10
期刊:JOURNAL OF COMPUTATIONAL BIOLOGY
影响因子:1.7
作者:Gu, Wenyan;Zhou, Aizhong;Zhu, Daming
通讯作者:Zhu, Daming
Algorithms and Hardness for Scaffold Filling to Maximize Increased Duo-Preservations
支架填充的算法和硬度,以最大限度地增加双体保存
DOI:10.1109/tcbb.2021.3083896
发表时间:2022-07-01
期刊:IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS
影响因子:4.5
作者:Ma,Jingjing;Jiang,Haitao;Yang,Runmin
通讯作者:Yang,Runmin
Genome-wide detection of cytosine methylations in plant from Nanopore data using deep learning.
使用深度学习从纳米孔数据中全基因组检测植物中的胞嘧啶甲基化
DOI:10.1038/s41467-021-26278-9
发表时间:2021-10-13
期刊:Nature communications
影响因子:16.6
作者:Ni P;Huang N;Nie F;Zhang J;Zhang Z;Wu B;Bai L;Liu W;Xiao CL;Luo F;Wang J
通讯作者:Wang J
Sorting a Permutation by Best Short Swaps
按最佳短交换对排列进行排序
DOI:10.1007/s00453-021-00814-x
发表时间:2021
期刊:ALGORITHMICA
影响因子:1.1
作者:Zhang Shu;Zhu Daming;Jiang Haitao;Guo Jiong;Feng Haodi;Liu Xiaowen
通讯作者:Liu Xiaowen
基因组结构相似性分析算法
  • 批准号:
    --
  • 项目类别:
    面上项目
  • 资助金额:
    55万元
  • 批准年份:
    2022
  • 负责人:
    朱大铭
  • 依托单位:
基因组比较与分析算法研究
  • 批准号:
    61472222
  • 项目类别:
    面上项目
  • 资助金额:
    83.0万元
  • 批准年份:
    2014
  • 负责人:
    朱大铭
  • 依托单位:
基因组比较问题的算法与复杂性
  • 批准号:
    61070019
  • 项目类别:
    面上项目
  • 资助金额:
    31.0万元
  • 批准年份:
    2010
  • 负责人:
    朱大铭
  • 依托单位:
基因组重组比较算法与复杂性研究
  • 批准号:
    60573024
  • 项目类别:
    面上项目
  • 资助金额:
    25.0万元
  • 批准年份:
    2005
  • 负责人:
    朱大铭
  • 依托单位:
多中心点问题的算法设计与应用
  • 批准号:
    60273032
  • 项目类别:
    面上项目
  • 资助金额:
    22.0万元
  • 批准年份:
    2002
  • 负责人:
    朱大铭
  • 依托单位:
基因组重组进化树问题的算法及复杂性
  • 批准号:
    60073042
  • 项目类别:
    面上项目
  • 资助金额:
    14.0万元
  • 批准年份:
    2000
  • 负责人:
    朱大铭
  • 依托单位:
国内基金
海外基金