基于深度迁移学习的微拟球藻蛋白质亚细胞定位预测方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    31900071
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    C0105.微生物学新技术与新方法
  • 结题年份:
    2022
  • 批准年份:
    2019
  • 项目状态:
    已结题
  • 起止时间:
    2020-01-01 至2022-12-31

项目摘要

Nannochloropsis oceanica has become a model industrial oleaginous alga. For the vast number of proteins encoded in its genome, determination of their subcellular localization (SCL) is of great significance for not just understanding the carbon-fixation and oil production mechanisms but also molecular breeding for superior microalgae. Conventional experimental approaches for SCL are based on fluorescence fusion protein, and suffer from the drawback of time-consuming and low-throughput operation; as a result, there were no sufficient training samples for establishing organism-specific SCL prediction tools. On the other hand, existing SCL prediction tools for microalgae are of low accuracy when applied in Nannochloropsis spp., as they are all trained using phylogenetically distant species. To tackle this challenge, this project proposed to design SCL prediction tools specifically for Nannochloropsis based on deep transfer neural network and high-throughput experimental localization. In N. oceanica, firstly, we will construct a plasmid library for the proteome, which is tagged with fluorescence protein, and establish high-throughput screening technique for detecting and discriminating particular SCL signals. Secondly, we will develop and optimize organism-specific SCL prediction tools, based on deep transfer learning method and by utilizing both the aforementioned high-throughput localization data and also from cross-species SCL datasets. Finally, by further validating and comparing the results of SCL, we hope to unravel previously unknown signaling peptide or regulatory mechanisms of SCL in N. oceanica. These efforts are expected to establish a high-accuracy SCL prediction tool for Nannochloropsis spp., and thus facilitate the mechanistic dissection of key traits and the precise delivery of foreign proteins for trait engineering, both of which key to the molecular breeding of superior industrial oleaginous microalgae.
海洋微拟球藻是工业产油微藻的模式物种之一,其蛋白质亚细胞定位对于固碳产油机制的理解和工业微藻分子育种具有重要意义。传统的荧光蛋白融合蛋白实验定位法耗时费力且通量极低,无法获取足够的训练样本以建立物种特异性的定位预测工具。而现有的微藻蛋白亚细胞定位预测工具都是基于亲缘关系较远的物种,在微拟球藻中准确率很低。因此,本项目拟基于深度迁移神经网络和高通量实验定位法,开发大幅提高该预测准确率的计算工具。在海洋微拟球藻中,首先,构建带荧光标记的蛋白质组质粒文库,并建立针对亚细胞定位的高通量筛选技术。然后,基于深度迁移学习方法,并利用高通量实验定位数据和跨物种的亚细胞定位数据集,建立并优化定位预测模型。最后,通过对亚细胞定位的深度验证和比较,挖掘其调控序列与机制。本项目建立的蛋白亚细胞定位预测方法,将促进工业产油微藻中关键表型的机制研究和基于外源蛋白精确定点表达的代谢工程,从而服务于工业微藻分子育种。

结项摘要

微拟球藻是重要的工业产油微藻,可以用来大规模生产甘油三酯(TAG)和二十碳五烯酸(EPA)。微拟球藻的油脂合成代谢途径较为复杂,需要多种细胞器的参与,高效、准确地确定微拟球藻重要蛋白质的亚细胞定位对固碳产油机制的理解和分子育种具有重要意义。由于蛋白质亚细胞定位的实验验证耗时、费力且通量低,目前微拟球藻中大多数蛋白质的亚细胞定位仍依赖于机器学习模型的预测,但现有预测工具对于类似微拟球藻的非模式物种准确率较低。本项目以微拟球藻为模式体系,验证了基于深度迁移学习方法构建物种专用的蛋白质亚细胞定位预测模型的可行性。首先,本项目全面收集整理了微拟球藻的多组学数据,建立了微拟球藻设计与合成数据库(NanDeSyn),并构建了基于序列扩增的训练数据集、迁移数据集和测试数据集。然后,本项目基于时间卷积神经网络与层次注意力机制建立了真核生物蛋白质亚细胞定位预测工具(PSCLSCA)。在此基础上,利用注意力机制回溯重要的肽段,验证了模型的有效性,并为预测结果提供了一种解释;另外,基于深度神经网络的随机失活机制建立了预测结果置信度与不确定性指标的量化方法。PSCLSCA的结构简单、预测准确率高,并且能够给出预测结果的不确定性估计。应用迁移数据集后,PSCLSCA的准确度显著提高,证明了迁移方法的有效性。再次,本项目验证了高通量实验验证方案主要环节的可行性。最后,本项目通过跨物种比较挖掘到微拟球藻中若干具有特殊亚细胞定位的蛋白质,并结合多组学分析,揭示了脂筏、高丝氨酸O-乙酰转移酶、碳酸酐酶、磷酸烯醇丙酮酸羧化激酶等对于微拟球藻固碳产油的潜在重要功能。本项目设计的预测工具已经借助NanDeSyn数据库网站提供给广大研究群体,成为工业产油微藻中关键表型的机制解析和工业微藻分子育种的重要支撑工具。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The NanDeSyn database for Nannochloropsis systems and synthetic biology
微拟球藻系统和合成生物学的 NanDeSyn 数据库
  • DOI:
    10.1111/tpj.15025
  • 发表时间:
    2020-11-27
  • 期刊:
    PLANT JOURNAL
  • 影响因子:
    7.2
  • 作者:
    Gong, Yanhai;Kang, Nam K.;Xu, Jian
  • 通讯作者:
    Xu, Jian

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

公衍海的其他基金

宏基因组生物标志物驱动的菌群单细胞基因组-表型组关联分析方法研究
  • 批准号:
    32370097
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码