Next generation Text Mining in Drug Discovery
药物发现中的下一代文本挖掘
基本信息
- 批准号:2760490
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2022
- 资助国家:英国
- 起止时间:2022 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Extracting interesting and non-trivial patterns from text documents is the next-generation wave of knowledge discovery in biochemical sciences. Free text resident in biomedical literature contains a wealth of information about small molecules and their targets that is not currently stored in biochemical knowledgebases. This information can be exploited to identify and build specific signatures for drug-gene associations, chemical and biological toxicity and even adverse drug effects.Recent advances in embedding methods have shown promising results for several biomedical and clinical tasks. Text classification performed on biomedical records poses specific challenges including dataset imbalance, miss-spellings, abbreviations or semantic ambiguity. Current state-of-the-art approaches apply deep learning to the task, mainly convolutional neural network (CNN), recurrent neural network (RNN), bi-directional long short term memory (Bi-LSTM), and BERT (Devlin et al.,2019; Wolf et al.,20).This project will contribute towards Exscientia' existing text mining platform by optimising named entity recognition (NER) procedures and applying novel machine learning strategies to generate your own semantic lexicon. It will have access to expertise across Discovery and AI technology teams to advise/support during the project.
从文本文档中提取有趣的和非平凡的模式是生物化学科学知识发现的下一代浪潮。生物医学文献中的自由文本包含了大量关于小分子及其靶点的信息,这些信息目前还没有存储在生物化学知识库中。这些信息可以被用来识别和构建药物基因关联、化学和生物毒性甚至药物不良反应的特定特征。包埋方法的最新进展已经为一些生物医学和临床任务带来了可喜的结果。对生物医学记录进行的文本分类提出了具体的挑战,包括数据集不平衡,拼写错误,缩写或语义模糊。当前最先进的方法将深度学习应用于任务,主要是卷积神经网络(CNN)、递归神经网络(RNN)、双向长短期记忆(Bi-LSTM)和BERT(Devlin et al.,2019; Wolf等人,20).该项目将通过优化命名实体识别(NER)程序和应用新颖的机器学习策略来生成自己的语义词典,为Exscientia现有的文本挖掘平台做出贡献。它将获得Discovery和AI技术团队的专业知识,在项目期间提供建议/支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
Internet-administered, low-intensity cognitive behavioral therapy for parents of children treated for cancer: A feasibility trial (ENGAGE).
针对癌症儿童父母的互联网管理、低强度认知行为疗法:可行性试验 (ENGAGE)。
- DOI:
10.1002/cam4.5377 - 发表时间:
2023-03 - 期刊:
- 影响因子:4
- 作者:
- 通讯作者:
Differences in child and adolescent exposure to unhealthy food and beverage advertising on television in a self-regulatory environment.
在自我监管的环境中,儿童和青少年在电视上接触不健康食品和饮料广告的情况存在差异。
- DOI:
10.1186/s12889-023-15027-w - 发表时间:
2023-03-23 - 期刊:
- 影响因子:4.5
- 作者:
- 通讯作者:
The association between rheumatoid arthritis and reduced estimated cardiorespiratory fitness is mediated by physical symptoms and negative emotions: a cross-sectional study.
类风湿性关节炎与估计心肺健康降低之间的关联是由身体症状和负面情绪介导的:一项横断面研究。
- DOI:
10.1007/s10067-023-06584-x - 发表时间:
2023-07 - 期刊:
- 影响因子:3.4
- 作者:
- 通讯作者:
ElasticBLAST: accelerating sequence search via cloud computing.
ElasticBLAST:通过云计算加速序列搜索。
- DOI:
10.1186/s12859-023-05245-9 - 发表时间:
2023-03-26 - 期刊:
- 影响因子:3
- 作者:
- 通讯作者:
Amplified EQCM-D detection of extracellular vesicles using 2D gold nanostructured arrays fabricated by block copolymer self-assembly.
使用通过嵌段共聚物自组装制造的 2D 金纳米结构阵列放大 EQCM-D 检测细胞外囊泡。
- DOI:
10.1039/d2nh00424k - 发表时间:
2023-03-27 - 期刊:
- 影响因子:9.7
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
细胞周期蛋白依赖性激酶Cdk1介导卵母细胞第一极体重吸收致三倍体发生的调控机制研究
- 批准号:82371660
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
Next Generation Majorana Nanowire Hybrids
- 批准号:
- 批准年份:2020
- 资助金额:20 万元
- 项目类别:
二次谐波非线性光学显微成像用于前列腺癌的诊断及药物疗效初探
- 批准号:30470495
- 批准年份:2004
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
Procedural Text Generation from Instructional Videos
从教学视频生成程序文本
- 批准号:
22KJ1666 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
A novel platform for synthetic generation and statistical obfuscation of tabular clinical data, simulated images, and machine-generated text
用于表格临床数据、模拟图像和机器生成文本的合成生成和统计混淆的新颖平台
- 批准号:
10696488 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Next generation Text Mining in Drug Discovery
药物发现中的下一代文本挖掘
- 批准号:
BB/X511833/1 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Training Grant
Unsupervised Neural Text Generation by Stochastic Searching
通过随机搜索生成无监督神经文本
- 批准号:
RGPIN-2020-04465 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Metacognition in Language Models: Using Model Confidence for Improved Natural Language Text Generation
语言模型中的元认知:利用模型置信度改进自然语言文本生成
- 批准号:
575626-2022 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Controllable text generation: toward non-toxic, unbiased and factual language models for sensitive applications
可控文本生成:针对敏感应用的无毒、公正和事实的语言模型
- 批准号:
2902174 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Studentship
Neuro-symbolic graph-to-text generation
神经符号图形到文本的生成
- 批准号:
492792184 - 财政年份:2022
- 资助金额:
-- - 项目类别:
WBP Fellowship
End-to-End Data-to-Text Generation for Summarizing Climate Change Systems
用于总结气候变化系统的端到端数据到文本生成
- 批准号:
575845-2022 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
CAREER: An Integrated Framework for Controllable Text Generation
职业:可控文本生成的集成框架
- 批准号:
2144493 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Continuing Grant
Knowledge based neural question generation from text
从文本生成基于知识的神经问题
- 批准号:
560815-2020 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Alliance Grants