基于多组学先验信息的串联质谱数据库搜索方法研究及应用

批准号:
31600667
项目类别:
青年科学基金项目
资助金额:
20.0 万元
负责人:
谢尚潜
依托单位:
学科分类:
C2103.生命组学技术
结题年份:
2019
批准年份:
2016
项目状态:
已结题
项目参与者:
于倩、栾奕昭、陈凯宁、陈聪颖、彭凯
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
串联质谱数据的蛋白鉴定是蛋白质组学研究的重要内容,数据库搜索方法是蛋白质质谱数据分析的主要方法。研究者长期通过挖掘图谱本身特征信息来提高肽段鉴定量,而融合多组学信息提高蛋白质鉴定量的报道相对较少。生物蛋白质表达需要经历基因转录和翻译过程,因此转录组和翻译组(多组学)的丰度信息可作为蛋白表达的先验信息加以利用。目前有研究证实利用多组学先验信息在数据库搜索方法中约束蛋白搜索库能提高肽段鉴定量,然而将多组学先验信息融入数据库搜索方法的打分模型还有待进一步研究。本项目拟将多组学丰度信息定量化为相应的蛋白存在概率,整合蛋白存在概率和基于图谱特征的打分算法构建新肽段打分模型,从而建立一种在打分模型中融入多组学先验信息的数据库搜索方法,并将该方法应用于肺癌蛋白质组学分析。新方法能有效增加实验串联质谱数据的信息利用率和提高蛋白质样品的肽段鉴定量,为蛋白质组学研究提供方法参考和技术支持。
英文摘要
Protein identification of tandem mass spectrometry (MS) data is an important content of proteomics, and database search algorithm (DSA) is the main method of MS data analysis. Researchers have tried for a long time to improve the identified peptide numbers of samples by digging into MS characteristic information, however integration of multi-omics information to improve the protein identification is rarely reported. Gene transcription and translation is the precondition of biological protein expression, so the abundance information of the transcriptomics and translatomics (multi-omics) can be used as prior information for protein expression. At present, some studies have confirmed that using multi-omics prior information constraint protein-searching database in DSA can increase the identified peptide numbers. Nevertheless, incorporating the multi-omics prior abundance information into the the scoring model remains to be further researched. This project intends to quantify the abundance information of multi-omics into the corresponding protein existing probability, and incorporates above probability and MS characteristic scoring algorithm to establish a new scoring model of DSA. Eventually this new scoring model will be applied to proteomics analysis of lung cancer. The new algorithm this project proposes can effectively increase the utilization of MS characteristic information and improve the identified peptide number of samples, and providing a new method for reference and technical support for proteomic study.
基因的转录和翻译与蛋白质表达息息相关,是实验图谱鉴定到蛋白质的重要前提和先决条件,人们长期通过挖掘图谱本身特征信息来提高肽段鉴定量,而融合多组学信息提高蛋白质鉴定量的报道相对较少。目前有研究证实利用多组学先验信息在数据库搜索方法中约束蛋白搜索库能提高肽段鉴定量,而将多组学先验信息融入数据库搜索方法的打分模型还有待进一步研究。本项目建立了翻译组和转录组丰度FPKM与蛋白鉴定的定量化模型,将转录组和翻译组丰度信息转化为相应的蛋白质存在先验概率;其次针对反库蛋白肽段无转录组和翻译组FPKM先验信息问题,建立了反库蛋白肽段的先验丰度FPKM的蛋白鉴定能力估算方法;再次结合正反库肽段对应的FPKM先验信息的蛋白鉴定能力,建立一种融入多组学FPKM先验信息的数据库搜索打分模型,通过新模型的得分获得可靠肽段。最后将新方法与Mascot、OMSSA、X!Tandem和pFind等主流蛋白鉴定软件进行比较,结果显示新方法具有更好的鉴定效果,在肽段和蛋白鉴定量上显著提高,融入转录组和翻译组先验信息的新方法在肽段上分别提高了3.39%-9.79%和10%-12%。本项目建立的整合多组学先验信息的数据库搜索方法能有效提高质谱数据的信息利用率和蛋白质样品的肽段鉴定量,为质谱数据分析提供重要的计算方法参考,为蛋白质组学的研究提供了新的研究思路和方法策略,尤其对基于多组学信息的蛋白质学研究具有重要的参考价值。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
MECAT : fast mapping, error correction, and de novo assembly for single-molecule sequencing reads
MECAT:单分子测序读取的快速作图、纠错和从头组装
DOI:10.1038/nmeth.4432
发表时间:2017-11-01
期刊:NATURE METHODS
影响因子:48
作者:Xiao, Chuan-Le;Chen, Ying;Xie, Zhi
通讯作者:Xie, Zhi
DNA N6-Methyladenosine modification role in transmitted variations from genomic DNA to RNA in Herrania umbratica.
DNA N6-甲基腺苷修饰在海拉尼亚 umbratica 基因组 DNA 到 RNA 传播变异中的作用
DOI:10.1186/s12864-019-5776-0
发表时间:2019
期刊:BMC Genomics
影响因子:4.4
作者:Luan Mei-Wei;Chen Wei;Xing Jian-Feng;Xiao Chuan-Le;Chen Ying;Xie Shang-Qian
通讯作者:Xie Shang-Qian
N (6)-Methyladenine DNA Modification in the Woodland Strawberry (Fragaria vesca) Genome Reveals a Positive Relationship With Gene Transcription.
林地草莓 (Fragaria vesca) 基因组中的 N-6-甲基腺嘌呤 DNA 修饰揭示了与基因转录的正相关关系
DOI:10.3389/fgene.2019.01288
发表时间:2019
期刊:Frontiers in Genetics
影响因子:3.7
作者:Xie Shang-Qian;Xing Jian-Feng;Zhang Xiao-Ming;Liu Zhao-Yu;Luan Mei-Wei;Zhu Jie;Ling Peng;Xiao Chuan-Le;Song Xi-Qiang;Zheng Jun;Chen Ying
通讯作者:Chen Ying
N6-Methyladenine DNA modification in Xanthomonas oryzae pv. oryzicola genome.
米黄单胞菌 (Xanthomonas oryzae pv.) 中的 N6-甲基腺嘌呤 DNA 修饰。
DOI:10.1038/s41598-018-34559-5
发表时间:2018-11-02
期刊:Scientific reports
影响因子:4.6
作者:Xiao CL;Xie SQ;Xie QB;Liu ZY;Xing JF;Ji KK;Tao J;Dai LY;Luo F
通讯作者:Luo F
Genome-wide codon usage pattern analysis reveals the correlation between codon usage bias and gene expression in Cuscuta australis
全基因组密码子使用模式分析揭示了菟丝子密码子使用偏差与基因表达之间的相关性。
DOI:10.1016/j.ygeno.2020.03.002
发表时间:2020-07-01
期刊:GENOMICS
影响因子:4.4
作者:Liu, Xu-Yuan;Li, Yu;Xie, Shang-Qian
通讯作者:Xie, Shang-Qian
融入三代测序全长转录组信息的新蛋白鉴定方法
- 批准号:--
- 项目类别:地区科学基金项目
- 资助金额:35万元
- 批准年份:2020
- 负责人:谢尚潜
- 依托单位:
基于三代测序全长转录组的特异性Isoform识别方法研究及特征分析
- 批准号:31760316
- 项目类别:地区科学基金项目
- 资助金额:35.0万元
- 批准年份:2017
- 负责人:谢尚潜
- 依托单位:
国内基金
海外基金
