ProtFunAI: AI based methods for functional annotation of proteins in crop genomes

ProtFunAI:基于人工智能的作物基因组蛋白质功能注释方法

基本信息

  • 批准号:
    BB/Y514044/1
  • 负责人:
  • 金额:
    $ 32.43万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2024
  • 资助国家:
    英国
  • 起止时间:
    2024 至 无数据
  • 项目状态:
    未结题

项目摘要

Our project will 'build on existing links and deepen existing relationships' between the two groups pioneering the development of AI/Deep-Learning models for proteins (Rost Group, TUM) and the application of these to protein domain families (Orengo Group, UCL). It will leverage world leading expertise in protein Language Models (pLMs) in order to accelerate the scientific discovery of protein functions in the genomes of key agricultural crops important for food security. However, our approaches will be generic and rolled out to all UniProt proteins through existing collaborations.Synergies between both groups have evolved over several collaborations. Since 2019, ground-breaking results tuned the pLMs developed in the Rost Group (e.g. the ProtTrans series, incl. ProtT5, ProtTucker) with protein family and functional family data (CATH superfamilies and FunFams) generated and maintained by the Orengo Group.The partnership proposed, here, would allow researchers in the Rost and Orengo Groups to intensify exchanges through visiting each others labs and interacting more comprehensively to design more effective protocols that enhance (1) protein homologue detection (2) protein function prediction and (3) protein functional site prediction.The Orengo and Rost Groups began collaborating in 2000 when working together on protein family analysis for target identification in the NIH-funded USA Structural Genomics initiative (PSI), which ended in 2015 [21-23]. Subsequently funding from the German BMBF (Federal German Research Ministry) and DFG (German Research Foundation) supported visits of PhD and Masters students from both groups and resulted in the development of new approaches for protein function prediction [14,15]. This application seeks funds to continue these collaborations to leverage the latest advances in AI/Deep Learning. The Rost Group recently enhanced their pLMs significantly (ProstT5 [18]) and the funding would allow us to apply ProstT5 to exploit the hugely expanded CATH classification, which is currently integrating hundreds of millions of predicted protein structures from the AlphaFold portal (AFDB).The application is very timely as it will address key BBSRC strategic priorities around data intensive biology and AI and the important challenge of food security. We will apply improved function prediction methods to significantly increase the functional annotations of plant genomes. This will bring 'new knowledge about key biological principles and mechanisms using AI-based approaches' and bring 'AI in sustainable agriculture and food' and enable 'smart agriculture' by identifying genes implicated in biological systems associated with growth and stress resistance e.g. drought and antimicrobial resistance. Most genes (typically >90%) from plants valuable as crops (e.g. wheat, maize, rice, sorghum) are experimentally uncharacterized or very poorly annotated. Our methods will be state-of-the-art to accurately guide experimental validation.We will disseminate the annotations using our established web-based CATH resource accessed by over 27,000 users/month. Since CATH data is also disseminated by PDB, UniProt and InterPro the predictions will be accessible to >900,000s of users/month. We will also work closely with collaborators in the UK researching plant genomes to get feedback and solicit experimental validation where possible.The project will significantly enhance the AI/ML skills of UK based researchers in the Orengo Group, whose prior training was largely in biology. On the flip side, the more AI-focused members from the Rost group will deepen their understanding of individual proteins, organisms, and evolution. German scholars will also dive deeper into the workings of UK-based resources.
我们的项目将“建立在现有的联系和深化现有的关系”之间的两个小组开拓蛋白质的AI/深度学习模型的开发(Rost Group,TUM)和这些蛋白质结构域家族的应用(Orengo Group,UCL)。它将利用世界领先的蛋白质语言模型(pLM)专业知识,以加速对粮食安全重要的关键农作物基因组中蛋白质功能的科学发现。然而,我们的方法将是通用的,并通过现有的合作推广到所有UniProt蛋白。两组之间的协同作用已经在几次合作中发展。自2019年以来,突破性的结果调整了Rost Group开发的pLM(例如ProtTrans系列,包括ProtT 5,ProtTucker)与蛋白质家族和功能家族数据(CATH超家族和FunFams)由Orengo集团生成和维护。在这里,将允许Rost和Orengo小组的研究人员通过访问彼此的实验室和更全面地互动来加强交流,以设计更有效的方案,增强(1)蛋白质同源物检测(2)蛋白质功能预测和(3)蛋白质功能位点预测。Orengo和Rost小组于2000年开始合作,当时在NIH资助的美国结构基因组学计划(PSI)中共同致力于蛋白质家族分析以进行靶标鉴定,该计划于2015年结束[21-23]。随后,来自德国BMBF(联邦德国研究部)和DFG(德国研究基金会)的资助支持了来自两个群体的博士和硕士生的访问,并导致了蛋白质功能预测新方法的开发[14,15]。该申请寻求资金来继续这些合作,以利用人工智能/深度学习的最新进展。Rost Group最近显著增强了他们的pLM(ProstT 5 [18])和资金将使我们能够应用ProstT 5来利用巨大扩展的CATH分类,目前正在整合来自AlphaFold门户网站(AFDB)的数亿个预测蛋白质结构。该应用程序非常及时,因为它将解决BBSRC围绕数据密集型生物学和人工智能以及食品的重要挑战的关键战略优先事项安全我们将应用改进的功能预测方法来显著增加植物基因组的功能注释。这将带来“关于使用基于人工智能的方法的关键生物学原理和机制的新知识”,并将“人工智能引入可持续农业和食品”,并通过识别与生长和抗逆性相关的生物系统中的基因来实现“智能农业”,例如干旱和抗菌素抗性。来自作为作物有价值的植物(例如小麦、玉米、水稻、高粱)的大多数基因(通常>90%)在实验上未被表征或注释得非常差。我们的方法将是最先进的,以准确地指导实验验证。我们将使用我们建立的基于网络的CATH资源传播注释,每月有超过27,000名用户访问。由于导管数据也由PDB、UniProt和InterPro传播,因此每月将有超过900,000名用户可以访问预测。我们还将与英国研究植物基因组的合作者密切合作,以获得反馈,并在可能的情况下征求实验验证。该项目将显著提高Orengo集团英国研究人员的AI/ML技能,他们之前的培训主要是生物学。另一方面,来自Rost团队的更多专注于AI的成员将加深他们对单个蛋白质,生物体和进化的理解。德国学者还将深入研究英国资源的运作。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christine Orengo其他文献

Understanding the structural and functional diversity of ATP-PPases using protein domains and functional families in the CATH database
利用CATH数据库中的蛋白质结构域和功能家族来理解ATP-PP酶的结构与功能多样性
  • DOI:
    10.1016/j.str.2024.12.016
  • 发表时间:
    2025-03-06
  • 期刊:
  • 影响因子:
    4.300
  • 作者:
    Jialin Yin;Vaishali P. Waman;Neeladri Sen;Mohd Firdaus-Raih;Su Datt Lam;Christine Orengo
  • 通讯作者:
    Christine Orengo
Progress towards mapping the universe of protein folds
  • DOI:
    10.1186/gb-2004-5-5-107
  • 发表时间:
    2004-01-01
  • 期刊:
  • 影响因子:
    9.400
  • 作者:
    Alastair Grant;David Lee;Christine Orengo
  • 通讯作者:
    Christine Orengo
Predicting protein function from sequence and structure
从序列和结构预测蛋白质功能
  • DOI:
    10.1038/nrm2281
  • 发表时间:
    2007-12-01
  • 期刊:
  • 影响因子:
    90.200
  • 作者:
    David Lee;Oliver Redfern;Christine Orengo
  • 通讯作者:
    Christine Orengo
Globalization : Approaches to Diversities
全球化:实现多元化的途径
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Benoit H Dessailly;Natalie L Dawson;Kenji Mizuguchi;Christine Orengo;Hector Cuadra-Montiel
  • 通讯作者:
    Hector Cuadra-Montiel

Christine Orengo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christine Orengo', 18)}}的其他基金

BBSRC-NSF/BIO: An AI-based domain classification platform for 200 million 3D-models of proteins to reveal protein evolution
BBSRC-NSF/BIO:基于人工智能的域分类平台,可用于 2 亿个蛋白质 3D 模型,以揭示蛋白质进化
  • 批准号:
    BB/Y001117/1
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
Improving accuracy, coverage, and sustainability of functional protein annotation in InterPro, Pfam and FunFam using Deep Learning methods PID 7012435
使用深度学习方法提高 InterPro、Pfam 和 FunFam 中功能蛋白注释的准确性、覆盖范围和可持续性 PID 7012435
  • 批准号:
    BB/X018563/1
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
Transforming the Structural Landscape of CATH to Aid Variant Analyses in Human and Agricultural Organisms and their Pathogens
改变 CATH 的结构景观以帮助人类和农业生物体及其病原体的变异分析
  • 批准号:
    BB/W018802/1
  • 财政年份:
    2022
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
Unlocking the chemical potential of plants: Predicting function from DNA sequence for complex enzyme superfamilies
释放植物的化学潜力:根据复杂酶超家族的 DNA 序列预测功能
  • 批准号:
    BB/V014722/1
  • 财政年份:
    2022
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
CATH-FunVar - Predicting Viral and Human Variants Affecting COVID-19 Susceptibility and Severity and Repurposing Therapeutics
CATH-FunVar - 预测影响 COVID-19 易感性和严重程度的病毒和人类变异并重新调整治疗用途
  • 批准号:
    BB/W003368/1
  • 财政年份:
    2021
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
3D-Gateway - Gateway to protein structure and function
3D-Gateway - 蛋白质结构和功能的门户
  • 批准号:
    BB/S020144/1
  • 财政年份:
    2020
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
Exploiting data driven computational approaches for understanding protein structure and function in InterPro and Pfam
利用数据驱动的计算方法来理解 InterPro 和 Pfam 中的蛋白质结构和功能
  • 批准号:
    BB/S020039/1
  • 财政年份:
    2020
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
SENSE - Screening of ENvironmental SEquences to discover novel protein functions, using informatics target selection and high-throughput validation
SENSE - 使用信息学目标选择和高通量验证筛选环境序列以发现新的蛋白质功能
  • 批准号:
    BB/T002735/1
  • 财政年份:
    2020
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
BBSRC-NSF/BIO Expanding the fold library in the twilight zone to facilitate structure determination of macromolecular machines
BBSRC-NSF/BIO 扩展暮光区折叠库以促进大分子机器的结构测定
  • 批准号:
    BB/S016007/1
  • 财政年份:
    2020
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
Increasing the Coverage and Accuracy of CATH for Comparative Genomics and Variant Interpretation
提高比较基因组学和变异解释的 CATH 的覆盖范围和准确性
  • 批准号:
    BB/R014892/1
  • 财政年份:
    2018
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant

相似国自然基金

AI 辅助药物设计姜黄素化合物的靶向结构修饰及其防治肝衰竭的成药性研究
  • 批准号:
    JCZRLH202500512
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
应用于AI芯片的先进封装TSV关键技术研发
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI驱动的工业微生物合成元件挖掘与产品智造
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于“治未病”理论构建AI赋能下的肥胖伴焦虑状态针灸数智化防治体系
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于AI 技术的高校网络舆情监测与治理路径研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于可穿戴设备与AI动态优化的阿尔茨海默病早期生活方式干预系统研发及效应研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
成渝交通一体化背景下的高速公路智慧管控系统:大数据驱动、AI预警与数智决策
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI驱动药物研发的技术发展趋势及重庆技术创新路径选择战略研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI赋能职业教育:“智慧职教”平台教学视频核心知识抽取研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
患者安全视角下医疗AI技术对医务人员风险感知的双刃剑机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

I-Corps: Centralized, Cloud-Based, Artificial Intelligence (AI) Video Analysis for Enhanced Intubation Documentation and Continuous Quality Control
I-Corps:基于云的集中式人工智能 (AI) 视频分析,用于增强插管记录和持续质量控制
  • 批准号:
    2405662
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Standard Grant
CRII: CPS: FAICYS: Model-Based Verification for AI-Enabled Cyber-Physical Systems Through Guided Falsification of Temporal Logic Properties
CRII:CPS:FAICYS:通过时态逻辑属性的引导伪造,对支持人工智能的网络物理系统进行基于模型的验证
  • 批准号:
    2347294
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Standard Grant
I(eye)-SCREEN: A real-world AI-based infrastructure for screening and prediction of progression in age-related macular degeneration (AMD) providing accessible shared care
I(eye)-SCREEN:基于人工智能的现实基础设施,用于筛查和预测年龄相关性黄斑变性 (AMD) 的进展,提供可及的共享护理
  • 批准号:
    10102692
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    EU-Funded
EcoTraceAI: A Novel AI-based Platform for data collection and validation for measuring the environmental impacts of the supply chain in the fashion industry.
EcoTraceAI:一个基于人工智能的新型平台,用于数据收集和验证,用于衡量时尚行业供应链的环境影响。
  • 批准号:
    10114149
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    SME Support
BBSRC-NSF/BIO: An AI-based domain classification platform for 200 million 3D-models of proteins to reveal protein evolution
BBSRC-NSF/BIO:基于人工智能的域分类平台,可用于 2 亿个蛋白质 3D 模型,以揭示蛋白质进化
  • 批准号:
    BB/Y000455/1
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
BBSRC-NSF/BIO: An AI-based domain classification platform for 200 million 3D-models of proteins to reveal protein evolution
BBSRC-NSF/BIO:基于人工智能的域分类平台,可用于 2 亿个蛋白质 3D 模型,以揭示蛋白质进化
  • 批准号:
    BB/Y001117/1
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
ViMuSe - a video-based AI music recommendation engine to improve creative efficiency and diversity.
ViMuSe - 基于视频的AI音乐推荐引擎,可提高创作效率和多样性。
  • 批准号:
    10104871
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Collaborative R&D
COMET: Communications Enabled, AI/ML based Digital Twins for Smart city Logistics and Last Mile applications
COMET:支持通信、基于 AI/ML 的数字孪生,用于智慧城市物流和最后一英里应用
  • 批准号:
    10099265
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Collaborative R&D
Using AI based modelling to drive the engineering of biology
使用基于人工智能的建模来推动生物学工程
  • 批准号:
    BB/Y514056/1
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Research Grant
SBIR Phase I: A web portal for artificial intelligence (AI)-based comprehensive discovery of repositioning drugs
SBIR 第一阶段:基于人工智能 (AI) 的重新定位药物综合发现门户网站
  • 批准号:
    2334510
  • 财政年份:
    2024
  • 资助金额:
    $ 32.43万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了