Machine Learning Algorithms for Actionable Knowledge Discovery in Synthetic Biology

合成生物学中可操作知识发现的机器学习算法

基本信息

  • 批准号:
    2132169
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2018
  • 资助国家:
    英国
  • 起止时间:
    2018 至 无数据
  • 项目状态:
    已结题

项目摘要

Synthetic biology applies engineering principles to design biological systems that do not exist in the natural world so as to achieve desired properties within a given organism. This approach is of great value to society since it can be used to produce high-value materials, such as fine chemicals, pharmaceuticals, bio-remediation, bio-fuels, etc. However, the inability to predict the behaviour of biological systems largely hinders progress in bioengineering applications. While domain knowledge fails to predict the effect of genotypes changes on phenotype, the development of machine learning techniques and tremendous amounts of data generated by omics technologies have made this possible. This project thus envisions innovative computational methods to discover actionable knowledge that can be fed into synthetic biology experiments and exploit in industry. The benefits are two-folds: (1) Meaningful biological findings deduced from omics information. (2) Novel machine learning model capable of extracting high-level information from high throughput dataset.More specifically, the main biological tasks are identifying biomarkers for a particular biological state, typically related to the risk, and constructing the biological network whose nodes representing gene, proteins, metabolites and edges indicating complex relations which can be functional or regulatory. For example, the first part of this project is to look at how bacteria, which are often used as the organism to design genetic circuits in synthetic biology, adjust their transciptomics to adapt to different environmental stimuli. This is very important as bacteria almost always experience a diverse range of stresses while growing in different conditions which may affect their own growth as well as the desired properties. To our knowledge no previous research has characterised genetic changes underpinning different biological states an organism may exhibit in various conditions, nor compensatory genetic circuit to relieve the stresses has been explored. This research will learn the phenotypical landscape of bacteria growing in various conditions, identify the genes responding to general stress conditions (i.e. the biomarkers), predict the cell state by looking at the gene expressions of these biomarkers (i.e. the gene fingerprint) and ultimately answer the question of how bacteria adjust their transcriptomics to adapt to different conditions in the form of a biological network. This work can be extended to any similar questions for different purpose while the same set of routines may be replicated.An automatic pipeline of data mining techniques will be designed to extract desired information from heavy noise, high dimension omics data. As a totally data-driven research to complement with detailed mechanistic understanding in domain knowledge, statistical tests and unsupervised learning algorithms such as differential expression analysis, dimension reduction and clustering methods will first be applied to effectively tackling the data dimensionality and extract interesting data patterns, based on which supervised learnings are followed. Biomarker identification will be achieved by devising feature selection methods embedded with classier that are robust to small sample size data. While biological networks can be much more flexible, the most widely studied ones are association networks where entities are only known to be functionally connected in some way. We aim to go beyond the mere association to causation by exploiting the structure and various representations of machine learning models being used to describe the biological processes, preferably in a probabilistic way.
合成生物学应用工程原理来设计自然界中不存在的生物系统,以便在给定的生物体中实现所需的特性。这种方法对社会有很大的价值,因为它可以用来生产高价值的材料,如精细化学品,药品,生物修复,生物燃料等,然而,无法预测的行为,生物系统在很大程度上阻碍了生物工程应用的进展。虽然领域知识无法预测基因型变化对表型的影响,但机器学习技术的发展和组学技术产生的大量数据使这成为可能。因此,该项目设想了创新的计算方法,以发现可用于合成生物学实验和工业开发的可操作知识。其好处是双重的:(1)从组学信息中推导出有意义的生物学发现。(2)新的机器学习模型能够从高通量数据集中提取高层次的信息。更具体地说,主要的生物学任务是识别特定生物状态的生物标志物,通常与风险相关,并构建生物网络,其节点代表基因,蛋白质,代谢物和边缘指示复杂的关系,可以是功能或调节。例如,该项目的第一部分是研究细菌如何调整其transciptomics以适应不同的环境刺激,细菌通常被用作合成生物学中设计遗传电路的生物体。这是非常重要的,因为细菌在不同的条件下生长时几乎总是经历各种各样的压力,这可能会影响它们自身的生长以及所需的特性。据我们所知,以前的研究还没有描述过生物体在各种条件下可能表现出的不同生物状态的遗传变化,也没有探索过缓解压力的补偿性遗传回路。这项研究将学习在各种条件下生长的细菌的表型景观,识别响应一般应激条件的基因(即生物标志物),通过观察这些生物标志物的基因表达(即基因指纹)来预测细胞状态,并最终回答细菌如何调整其转录组学以适应生物网络形式的不同条件的问题。本文的工作可以扩展到任何类似的问题,用于不同的目的,而同一套例程可以复制。数据挖掘技术的自动管道将被设计为从高噪声,高维组学数据中提取所需的信息。作为一个完全数据驱动的研究,以补充详细的机械理解领域知识,统计测试和无监督学习算法,如差分表达式分析,降维和聚类方法将首先应用于有效地处理数据维度和提取有趣的数据模式,在此基础上进行监督学习。生物标志物识别将通过设计嵌入分类器的特征选择方法来实现,该方法对小样本数据具有鲁棒性。虽然生物网络可以更灵活,但研究最广泛的是关联网络,其中实体仅以某种方式在功能上连接。我们的目标是通过利用机器学习模型的结构和各种表示来描述生物过程,最好是以概率的方式,超越纯粹的关联。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Computational Strategies for the Identification of a Transcriptional Biomarker Panel to Sense Cellular Growth States in Bacillus subtilis.
  • DOI:
    10.3390/s21072436
  • 发表时间:
    2021-04-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Huang Y;Smith W;Harwood C;Wipat A;Bacardit J
  • 通讯作者:
    Bacardit J
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
  • 批准号:
    2337776
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
  • 批准号:
    2422926
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
CAREER: Gaussian Processes for Scientific Machine Learning: Theoretical Analysis and Computational Algorithms
职业:科学机器学习的高斯过程:理论分析和计算算法
  • 批准号:
    2337678
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
XTRIPODS: Algorithms and Machine Learning in Data Intensive Models
XTRIPODS:数据密集型模型中的算法和机器学习
  • 批准号:
    2342527
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
AF:RI:Small: Fairness in allocation and machine learning problems: algorithms and solution concepts
AF:RI:Small:分配公平性和机器学习问题:算法和解决方案概念
  • 批准号:
    2334461
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
STINMALE: Strategic Interactions with Machine-Learning Algorithms: The Role of Simple Beliefs
STINMALE:与机器学习算法的战略交互:简单信念的作用
  • 批准号:
    EP/Y033361/1
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Research Grant
CAREER: Interpretable and Robust Machine Learning Models: Analysis and Algorithms
职业:可解释且稳健的机器学习模型:分析和算法
  • 批准号:
    2239787
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Next-Generation Algorithms in Statistical Genetics Based on Modern Machine Learning
基于现代机器学习的下一代统计遗传学算法
  • 批准号:
    10714930
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    2311500
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了