PDP-PEG-Biotin化学小分子辅助测序实现棉花基因组精细结构

批准号:
21602162
项目类别:
青年科学基金项目
资助金额:
20.0 万元
负责人:
吴志国
依托单位:
学科分类:
B0707.化学生物学理论、方法与技术
结题年份:
2019
批准年份:
2016
项目状态:
已结题
项目参与者:
朱玉贤、温兴鹏、杨闫
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
高等植物基因组的精细结构,是研究功能基因以及分子机制的基础。棉花细胞染色体端粒以及基因组中富含G的序列在测序过程中PCR扩增效率远低于随机序列,导致在序列组装时产生大量的gap。本项目结合化学与生物学的方法,可能对富含G序列分离测序从而实现棉花基因组的精细结构。化学合成生物素标记的有机小分子(PDP-PEG-Biotin),特异性的识别棉花基因组中富含G的序列,由链酶亲和素磁珠分离富集,并进行第三代SMRT测序。再将富含G的序列组装拼接到棉花基因组草图,得到棉花基因组精细结构,进而解析隐匿在端粒区的功能基因。本项目基于基因组DNA的二级结构,应用化学小分子将测序中扩增效率低的片段分离富集,从而实现棉花基因组的精细结构。化学小分子辅助测序手段的加入,可能大大提高动植物基因组的解析度,提高大基因组测序组装的完整性和准确度。
英文摘要
High-quality genome sequences and accurate gene annotations of higher plants are the basis for investigation of plant gene functions and molecule mechanism of cell development. Telomeres of cotton chromosomes and other G-rich sequences in cotton genomes are hard to be sequenced and assembled because of low amplification efficiency in the PCR processes, resulting in large numbers of gaps in genome sequences. In this study, we will employ interdisciplinary principles and methods to resolve the G-rich sequence issue based on chemistry and biology. Pyridostatin type small molecules (PDP/PDS) are synthesized and labeled by biotin, with a long PEG linker in the bifunctional compound to reduce the steric hindrance. G-rich sequences in cotton genome could be specifically bound by PDP/PDS, and the complexes could be captured and enriched by streptavidin beads. The purified DNA with G-rich sequences is sequenced by Single Molecule Real-Time (SMRT) technology and data are assembled with reference genome. The functional genes buried in telomere region could be dissected with the high-quality genome. The significant advantage of this strategy is the application of small molecules to assist with high-quality genome sequencing and assembly, and this strategy could be used in other genome assembly with much higher resolution and much lower cost.
真核细胞基因组中富含鸟嘌呤的序列在测序过程中PCR扩增效率远低于随机序列,导致基因组序列拼接的不完整。本项目结合化学与生物学的方法,对富含鸟嘌呤的人类以及棉花基因组序列富集测序从而实现基因组功能区域的精细解析。化学合成了一个柔性链连接的有机小分子化合物PDP-PEG-Biotin,特异性的识别并富集细胞中富含鸟嘌呤的DNA序列,经高通量测序鉴定到五万个潜在的G四链体位点。用该小分子孵育HEK 293T细胞72小时,观测到超过四千个基因表达显著上调或下调。预示该小分子具有通过结合G4结构调控活细胞内基因表达的活性。综合第三代长读长测序技术PacBio,HiC以及Illumina seq对雷蒙德氏棉(D5)的基因组进行了重新测序组装,13条染色体级别序列长度达到783Mb,Contig N50达到6.2Mb,Scaffold N50达到了58.4Mb,共有20个完整端粒结构得到了确定。47%的D5基因组序列为LTR/TE,并且通过高斯概率密度方程计算得到TE的爆发时间为5.7百万年前。计算发现亚洲棉基因组中Ty1类型转座子集中在最近三十万年内爆发,通过高通量转录本测序比对找到Ty1类转座子仍然在表达的IN和RT蛋白结构域。Chip-qPCR实验证实Ty1类转座酶结合在亚洲棉和陆地棉部分功能基因的第一个外显子上,预示着转座酶具有调控棉花基因表达的新的活性。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Small-molecule-based human genome G4 profiling reveals potential gene regulation activity
基于小分子的人类基因组 G4 分析揭示了潜在的基因调控活性
DOI:10.1039/c8cc10052g
发表时间:2019
期刊:Chemical Communications
影响因子:4.9
作者:Zeng Weiwu;Wu Fan;Liu Chaoxing;Yang Yan;Wang Bingyao;Yuan Yushu;Wang Jiaqi;Chen Yuqi;Fu Boshi;Wu Zhiguo;Zhou Xiang
通讯作者:Zhou Xiang
国内基金
海外基金
