基于三代测序全长转录组的特异性Isoform识别方法研究及特征分析
结题报告
批准号:
31760316
项目类别:
地区科学基金项目
资助金额:
35.0 万元
负责人:
谢尚潜
依托单位:
学科分类:
C0608.生物数据资源与分析方法
结题年份:
2021
批准年份:
2017
项目状态:
已结题
项目参与者:
朱婕、张雨、陈琼、韩惠蕊、李霆格、操太煜
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
转录本Isoform是由基因可变剪切引起的一种常见现象,在基因的表达和调控中发挥着重要作用。基于二代测序的RNA-seq是目前研究转录本Isoform的最主要方法,然而利用RNA-seq的短序列组装完全解析转录本Isoform仍面临一定的困难。相对于RNA-seq技术,基于三代测序的Iso-seq技术具有读长序列长,全长转录本无需组装的明显优势。目前Iso-seq主要用于研究新Isoform、可变剪切和基因融合等问题,而利用Iso-seq从全转录组水平探索特异性Isoform的表达类型和丰度,以及结合多组学解析Isoform的序列特征鲜有报道。因此,本研究提出建立基于三代测序全长转录本的特异性Isoform识别方法,并结合翻译组信息分析Isoform的序列特征,为生物学研究中深入解析基因的转录和翻译调控提供新的方法和研究策略。
英文摘要
Transcript isoform, caused by gene alternative splicing, is a common phenomenon and plays an important role in the gene expression and regulation of biological process. Currently, RNA-seq based on next-generation sequencing is the main technology for isoform research. However, identification of isoform from RNA-seq data is still challenging because of the short reads assembly of full-length transcript. Iso-seq, the third-generation sequencing technology, has a significant advantage over RNA-seq for full-length isoform identification with the long reads capability. At present, the main application of Iso-seq is focused on discovering novel isoform, gene alternative splicing and gene fusion. Nevertheless, the transcriptome-wide isoform expression and its abundance, and the sequence feature analysis by incorporating multi-omics information remains to be further studied. Therefore, this project intend to propose a method for identifying specific isoform based on the full-length transcripts from Iso-seq data, and analyze the isoform sequence feature by incorporating translatomics information. This new method will provide a novel strategy for in-depth analysis of gene transcription and translation in biological research.
转录本Isoform是由基因可变剪切引起的常见现象,在基因的表达和调控中发挥重要作用。基于二代测序的RNA-seq是目前研究转录本Isoform的最主要方法,然而利用RNA-seq的短序列组装完全解析转录本Isoform仍面临一定的困难。相对于RNA-seq技术,基于三代测序的Iso-seq技术具有读长序列长,全长转录本无需组装的明显优势。目前Iso-seq主要用于研究新Isoform、可变剪切和基因融合等问题,而利用Iso-seq从全转录组水平探索特异性Isoform的序列特征及相应的生物学含义少有报道。本项目基于三代测序的Iso-seq技术读长序列长和全长转录本无需组装的优势,建立了三代测序全长转录本的特异性Isoform识别方法,主要内容包括:1.收集三代测序全长转录组数据,建立了国际上首个全长转录组数据库ISOdb;2.利用Isoform的归并信息,整合了翻译组的翻译本和丰度信息;3.利用深度学习建立了可识别不同剪切类型的(内含子保留,外显子跳跃,3’端选择性剪切和5’端选择性剪切)的特异性Isoform的识别方法;4. 利用特异性识别Isoform的特征基序进行生物学解析。本项目的开展为Isoform水平深入解析基因的调控提供一种新研究策略和方法,为理解复杂的致病或抗性等生物学问题带来了一定的帮助。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
MDR: an integrative DNA N6-methyladenine and N4-methylcytosine modification database for Rosaceae
MDR:蔷薇科 DNA N6-甲基腺嘌呤和 N4-甲基胞嘧啶综合修饰数据库
DOI:10.1038/s41438-019-0160-4
发表时间:2019-06-15
期刊:HORTICULTURE RESEARCH
影响因子:8.7
作者:Liu, Zhao-Yu;Xing, Jian-Feng;Xiao, Chuan-Le
通讯作者:Xiao, Chuan-Le
DNA N6-Methyladenosine modification role in transmitted variations from genomic DNA to RNA in Herrania umbratica.
DNA N6-甲基腺苷修饰在海拉尼亚 umbratica 基因组 DNA 到 RNA 传播变异中的作用
DOI:10.1186/s12864-019-5776-0
发表时间:2019
期刊:BMC Genomics
影响因子:4.4
作者:Luan Mei-Wei;Chen Wei;Xing Jian-Feng;Xiao Chuan-Le;Chen Ying;Xie Shang-Qian
通讯作者:Xie Shang-Qian
SCSit: A high-efficiency preprocessing tool for single-cell sequencing data from SPLiT-seq.
SCSit:一种用于 SPLiT-seq 的单细胞测序数据的高效预处理工具。
DOI:10.1016/j.csbj.2021.08.021
发表时间:2021
期刊:Computational and structural biotechnology journal
影响因子:6
作者:Luan MW;Lin JL;Wang YF;Liu YX;Xiao CL;Wu R;Xie SQ
通讯作者:Xie SQ
N (6)-Methyladenine DNA Modification in the Woodland Strawberry (Fragaria vesca) Genome Reveals a Positive Relationship With Gene Transcription.
林地草莓 (Fragaria vesca) 基因组中的 N-6-甲基腺嘌呤 DNA 修饰揭示了与基因转录的正相关关系
DOI:10.3389/fgene.2019.01288
发表时间:2019
期刊:Frontiers in Genetics
影响因子:3.7
作者:Xie Shang-Qian;Xing Jian-Feng;Zhang Xiao-Ming;Liu Zhao-Yu;Luan Mei-Wei;Zhu Jie;Ling Peng;Xiao Chuan-Le;Song Xi-Qiang;Zheng Jun;Chen Ying
通讯作者:Chen Ying
N6-Methyladenine DNA modification in Xanthomonas oryzae pv. oryzicola genome.
米黄单胞菌 (Xanthomonas oryzae pv.) 中的 N6-甲基腺嘌呤 DNA 修饰。
DOI:10.1038/s41598-018-34559-5
发表时间:2018-11-02
期刊:Scientific reports
影响因子:4.6
作者:Xiao CL;Xie SQ;Xie QB;Liu ZY;Xing JF;Ji KK;Tao J;Dai LY;Luo F
通讯作者:Luo F
融入三代测序全长转录组信息的新蛋白鉴定方法
  • 批准号:
    --
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    35万元
  • 批准年份:
    2020
  • 负责人:
    谢尚潜
  • 依托单位:
基于多组学先验信息的串联质谱数据库搜索方法研究及应用
  • 批准号:
    31600667
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2016
  • 负责人:
    谢尚潜
  • 依托单位:
国内基金
海外基金