Graph learning methods for engieering mammalian promoters in bioproduction
生物生产中哺乳动物启动子的图学习方法
基本信息
- 批准号:2786047
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2023
- 资助国家:英国
- 起止时间:2023 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
mRNA COVID-19 vaccines have effectively prevented hospitalization and deathduring the pandamic. Bioproduction of valuable vaccines and biotherapeuticsin mammalian cell lines can be achieved, but it is difficult to develop robust,predictable, and sustainable expression. The design of enhanced mammalianpromoters and genetic circuits is therefore a key strategic industrial target. Thisproject aims to explore the structural properties of large-scale transcriptomicdatasets with graph representation learning to optimise engineered promoters inmammalian cells. Demonstration will be performed in mammalian cell lines us-ing automated DNA assembly and analytics available at the London Biofoundry.As part of this project, multiple publicly available transcriptomic datasetswill be used, including the EPD [2], DEE2 uniform transcriptomic database[7], and SRA [5] for constructing heterogeneous graphs, in which each noderepresents a set of DNA sequences (i.e. promoters and genes); edge types aredetermined by the biological context shared by two nodes. The initial noderepresentation may be generated using the internal DNA sequence structure.With constructed heterogeneous network, there are two objectives: Firstly,we will use Graph neural networks (GNNs) [3, 4, 8] to learn the representationof each node in the network, which maps the nodes into embedding space toreflect the graph structure. In this way, the cellular and environmental con-text will be embedded into the learnt node representations; and then we canuse the resulting node embedding to predict the promoter activity (i.e. thespeed and quantity of gene expression). Promoter activity prediction task maybe integrated with the representation learning process or solved using separatepredictors. The second stage of the project will combine results from exper-iments to iteratively refine the GNNs. The trained model will select a baseset of 50-100 promoters functional over a range of conditions and with desiredperformance to be used as starting point for synthetic promoter design. In col-laboration with the London Biofoundry, their characteristics will be tested intransient transfection to eliminate changes in behaviour due to differences incopy number and physical context. Promoters with verified behaviour will beused by the GNNs algorithm as modular building blocks to build a set of 50synthetic promoters with designed behaviour. Construct performance will becompared against predictions generated by the GNNs and used to refine modelperformance.Overall, the project will leverage the expression power of GNNs and thelarge-scale transcriptomic datasets to develop a broadly applicable frameworkfor gene expression problem analysis, with the application in predicting con-textual promoter behaviours and engineering new mammalian promoters. Inaddition, the interpretability of learnt model can be achieved by applying sym-bolic regression [1] and GNN-explainer [6].
新冠肺炎基因疫苗有效地防止了熊猫期间的住院和死亡。在哺乳动物细胞系中可以实现有价值的疫苗和生物治疗的生物生产,但很难开发出健壮、可预测和可持续的表达。因此,设计增强型哺乳动物启动子和基因电路是一个关键的战略性工业目标。这个项目的目的是探索大规模转录数据集的结构特性,并学习如何在哺乳动物细胞中优化工程启动子。作为该项目的一部分,将使用多种公开可用的转录数据集,包括EPD[2]、DEE2统一转录数据库[7]和SRA[5],用于构建异质图,其中每个节点表示一组DNA序列(即启动子和基因);边类型由两个节点共享的生物背景决定。首先,利用图神经网络[3,4,8]来学习网络中每个节点的表示,将节点映射到嵌入空间来反映图的结构。这样,细胞和环境的上下文将被嵌入到学习的节点表示中,然后我们可以使用所得到的节点嵌入来预测启动子的活性(即基因表达的速度和数量)。启动子活性预测任务可以与表示学习过程相结合,也可以使用分离预测器来求解。该项目的第二阶段将结合实验的结果,反复改进GNN。经过训练的模型将选择50-100个启动子的基本集合,这些启动子在一系列条件下起作用,并具有期望的性能,作为合成启动子设计的起点。在与伦敦生物铸造厂的合作中,他们的特征将在瞬时转基因中进行测试,以消除由于拷贝数量和物理环境的差异而导致的行为变化。GNNS算法将使用具有验证行为的启动子作为模块构建块,以构建一组具有设计行为的50个合成启动子。构建性能将与GNN产生的预测进行比较,并用于改进模型。总的来说,该项目将利用GNN的表达能力和大规模转录数据集来开发一个广泛适用的框架,用于基因表达问题分析,并应用于预测上下文启动子行为和设计新的哺乳动物启动子。此外,学习模型的可解释性可通过应用符号回归[1]和GNN-解释器[6]来实现。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
- 批准号:31971003
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
- 批准号:61702207
- 批准年份:2017
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
Discovering clinical endpoints of toxicity via graph machine learning and semantic data analysis
通过图机器学习和语义数据分析发现毒性的临床终点
- 批准号:
10745593 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Constructing a large-scale biomedical knowledge graph using all PubMed abstracts and PMC full-text articles and its applications
利用所有PubMed摘要和PMC全文文章构建大规模生物医学知识图谱及其应用
- 批准号:
10648553 - 财政年份:2023
- 资助金额:
-- - 项目类别:
SCH: Graph-based Spatial Transcriptomics Computational Methods in Kidney Diseases
SCH:肾脏疾病中基于图的空间转录组学计算方法
- 批准号:
10816929 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Annotating dark ion-channel functions using evolutionary features, machine learning and knowledge graph mining
使用进化特征、机器学习和知识图挖掘注释暗离子通道函数
- 批准号:
10457684 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Graph Learning of Cell-cell Communications in Spatial Transcriptomics
空间转录组学中细胞间通信的图学习
- 批准号:
10661087 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Annotating dark ion-channel functions using evolutionary features, machine learning and knowledge graph mining (Kennady Boyd)
使用进化特征、机器学习和知识图挖掘注释暗离子通道函数 (Kennady Boyd)
- 批准号:
10809950 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Annotating dark ion-channel functions using evolutionary features, machine learning and knowledge graph mining
使用进化特征、机器学习和知识图挖掘注释暗离子通道函数
- 批准号:
10661550 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Annotating dark ion-channel functions using evolutionary features, machine learning and knowledge graph mining (Rayna Carter)
使用进化特征、机器学习和知识图挖掘注释暗离子通道函数 (Rayna Carter)
- 批准号:
10809931 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Graph Learning of Cell-cell Communications in Spatial Transcriptomics
空间转录组学中细胞间通信的图学习
- 批准号:
10504269 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Continuing Tool Development for Longitudinal Network Analysis: Enriching the Diagnostic Power of Disease-Specific Connectomic Biomarkers by Deep Graph Learning
纵向网络分析的持续工具开发:通过深度图学习丰富疾病特异性连接组生物标志物的诊断能力
- 批准号:
10359157 - 财政年份:2021
- 资助金额:
-- - 项目类别: