Discovery & Synthesis Chemputer: An intelligent universal system for automated chemical synthesis and discovery across different hardware and scales

发现

基本信息

  • 批准号:
    10905022
  • 负责人:
  • 金额:
    $ 21.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-06-01 至 2024-04-30
  • 项目状态:
    已结题

项目摘要

Project Summary In this supplement to the collaborative project initiated between the Digital Chemistry Group at the University of Glasgow and The NCATS ASPIRE laboratory we will deepen the integration of the χDL chemical programming language with the Open Reaction Database (ORD) as well as integrating Large Language Model (LLM)-based AI approaches into the generation of χDL procedures directly from retrosynthetic analyses of target compounds. This work will be accomplished during the term of the original grant. Two specific aims are proposed: 1. Develop a χDL to ORD bridge which can be instantiated on a chemputer-based physical synthesis platform. (Coley Lab collaboration); 2. Integrate large language models (LLMs) within the Chemical Description Language (χDL) framework to generate develop and interface χDLs for closed-loop active learning infrastructures (Chopra Lab collaboration). These aims will be developed over the term of the funding in a highly integrated and collaborative working modus operandi. For specific aim one we will develop a set of converters bridging the three stages of the experimental life cycle: planning, execution, and reporting. This is achieved by integrating the planning and reporting stages, which can be fully represented by the structured data schema of the ORD, with the central stage of execution, which is fully expressible in χDL. These converters will include some level of inference, through heuristics or otherwise, to fill in procedural details that might not be explicitly defined in the original plan. They can also validate if a plan can be executed in a particular lab in terms of hardware compatibility. We will realize such converters as open-source software tools and test these tools on a chemputer hardware platform for a set of benchmark reactions. For specific aim two we will develop an extension to our Natural Language Processing (NLP) approach to χDL procedure generation by using generated data sets to train a LLM AI system to be able to produce χDL instruction files directly from retrosynthetic analysis of a desired molecular structure. This will be accomplished by building a custom set of LLM agents designed to utilize the χDL NLP model to interpret and write valid χDL code based on user input. By integrating these with the χDL blueprints which are being developed for benchmark reactions as part of the NCATS ASPIRE collaboration, these χDL instructions can then be generated from automated retrosynthetic analysis of a given molecule, or class of molecules even if the suggested reactions do not yet exist in the chemical literature. We will produce specifications for a further LLM based AI system to interpret the data generated by automatic analysis and to suggest new subsequent experiments based on a pre-defined fitness function optimization (for example yield or purity of products) which can be defined experimentally in the automated system.
项目摘要 在这项补充的补充中,在大学数字化学小组之间启动 格拉斯哥和NCATS ASPIRE实验室,我们将加深χDL化学编程的整合 具有开放反应数据库(ORD)的语言以及基于大型语言模型(LLM)的语言 AI直接从靶化合物的循环分析中直接进入χDL程序的生成。 这项工作将在原始赠款期间完成。提出了两个具体目标:1。发展 可以在基于化学的物理合成平台上实例化的ORD桥的χDL。 (科利实验室 合作); 2。将大型语言模型(LLM)整合到化学描述语言(χDL)中 用于生成开发和界面χDL的框架,用于闭环主动学习基础设施(Chopra Lab 合作)。这些目标将在高度融合和协作的资金期间开发 工作作案手法。对于特定目标,我们将开发一组桥接的转换器 实验生命周期:计划,执行和报告。这是通过整合计划和 报告阶段,可以由ORD的结构化数据模式完全表示,并带有中央 执行阶段,在χDL中完全表达。这些转换器将包括一定程度的推理, 通过启发式方法或其他方式填写原始计划中可能未明确定义的程序细节。 他们还可以验证是否可以根据硬件兼容性在特定实验室执行计划。我们将 实现开源软件工具等转换器,并在Chemputer硬件平台上测试这些工具 用于一组基准反应。对于特定目标两个,我们将开发自然语言的扩展 通过使用生成的数据集训练LLM AI系统,处理(NLP)方法生成χDL过程 能够直接通过对所需分子结构的递归合成分析产生χDL指令文件。 这将通过构建旨在利用χDLNLP模型的自定义LLM代理来实现 根据用户输入来解释和写入有效的χDL代码。通过将它们与χDL蓝图集成在一起 作为NCATS ASPIRE协作的一部分,是为基准反应开发的,这些χDL说明 然后,可以通过对给定分子的自动反折分析或分子类别产生 如果建议的反应在化学文献中尚不存在。我们将产生进一步的规格 基于LLM的AI系统来解释通过自动分析生成的数据,并建议新的后续序列 基于预定义的健身功能优化(例如产量或产品的纯度)的实验,该功能 可以在自动化系统中实验定义。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

GAURAV CHOPRA其他文献

GAURAV CHOPRA的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('GAURAV CHOPRA', 18)}}的其他基金

Chemical instruments-aware distributed blockchain based open AI platform to accelerate drug discovery
基于化学仪器感知的分布式区块链开放人工智能平台,加速药物发现
  • 批准号:
    10448092
  • 财政年份:
    2022
  • 资助金额:
    $ 21.72万
  • 项目类别:
Chemical instruments-aware distributed blockchain based open AI platform to accelerate drug discovery
基于化学仪器感知的分布式区块链开放人工智能平台,加速药物发现
  • 批准号:
    10665719
  • 财政年份:
    2022
  • 资助金额:
    $ 21.72万
  • 项目类别:
Development of a high throughput system for molecular imaging of different cell types in mouse brain tissues
开发用于小鼠脑组织中不同细胞类型的分子成像的高通量系统
  • 批准号:
    10369883
  • 财政年份:
    2021
  • 资助金额:
    $ 21.72万
  • 项目类别:

相似国自然基金

人工智能驱动的营销模式和消费者行为研究
  • 批准号:
    72332006
  • 批准年份:
    2023
  • 资助金额:
    165 万元
  • 项目类别:
    重点项目
基于“人工智能算法+高精度遥感数据”的棉花表型信息识别及解析
  • 批准号:
    32360436
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
巴氏杀菌乳中金黄色葡萄球菌和肠毒素A风险预测和溯源的人工智能模型构建研究
  • 批准号:
    32302241
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
制造企业人工智能工作场景下员工AI认同影响机制与员工主动行为内在机理研究
  • 批准号:
    72362025
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目
基于原子贡献与人工智能的萃取精馏溶剂分子设计研究
  • 批准号:
    22308037
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Data Management Core
数据管理核心
  • 批准号:
    10682165
  • 财政年份:
    2023
  • 资助金额:
    $ 21.72万
  • 项目类别:
ClinEX - Clinical Evidence Extraction, Representation, and Appraisal
ClinEX - 临床证据提取、表示和评估
  • 批准号:
    10754029
  • 财政年份:
    2023
  • 资助金额:
    $ 21.72万
  • 项目类别:
Artificial Intelligence for Dynamic, individualized CPR guidance: AID CPR
人工智能提供动态、个性化的心肺复苏指导:AID CPR
  • 批准号:
    10644648
  • 财政年份:
    2023
  • 资助金额:
    $ 21.72万
  • 项目类别:
Discovering clinical endpoints of toxicity via graph machine learning and semantic data analysis
通过图机器学习和语义数据分析发现毒性的临床终点
  • 批准号:
    10745593
  • 财政年份:
    2023
  • 资助金额:
    $ 21.72万
  • 项目类别:
Personalized Risk Stratification in Atrial Fibrillation using Portable, Explainable Artificial Intelligence
使用便携式、可解释的人工智能对心房颤动进行个性化风险分层
  • 批准号:
    10905154
  • 财政年份:
    2023
  • 资助金额:
    $ 21.72万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了