Prostate cancer is a heterogeneous disease, displaying a multitude of genetic alterations, histological patterns and clinical outcomes. This heterogen

前列腺癌是一种异质性疾病,表现出多种基因改变、组织学模式和临床结果。

基本信息

  • 批准号:
    2432020
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2020
  • 资助国家:
    英国
  • 起止时间:
    2020 至 无数据
  • 项目状态:
    未结题

项目摘要

The main aims of this project is to leverage recent advances in Natural Language Processing (NLP) to develop end-to-end clinical support systems which can utilise longitudinal free text documents within Electronic Health Records (EHRs). EHRs will often contain historic records, pertaining to all interactions between a patient and the healthcare service, including freetext documents, such as referral letters and discharge notes. A notable challenge is being able to adequately capturing longitudinal representations of clinical texts. Common state-of-the-art models such as the Bidirectional Encoder Representations fromTransformers (BERT) can only process sequences of 512 tokens (Devlin et al., 2018), but a years worth of clinical text for a single patient can consist of more than 10, 000 tokens. Another more general problem relates to the transparency, interpretability and algorithmic fairness of large language models. Therefore this project aims to develop methods and protocol to enhance these aspects.One proposed approach to representing sequential free-textbuilds upon the signature of a path, a non-parametric approach to extracting features from data in the form of tensors(Chevyrev and Kormilitzin, 2016). Loosely speaking, a signature is a collection of statistics about a stream of data that are time invariant, and has universal non-linearity, whereby it is sufficient to capture all possibly nonlinear functions of the original data: allowing aunique approach to representing complex sequential data. Combining signature techniques with strategies to address the limited ability of attention mechanisms in common transformer basedmodels, such as spare-attention mechanisms (Zaheer et al., 2020). This hybrid approach should allow efficient computation and representations of patients clinical text history, usable in a numberof relevant downstream tasks.Another approach will embrace a new paradigm shift in NLP research, named prompt-learning. Traditional approaches tomany downstream tasks involved taking a model such as BERT pre-trained on masked language modelling (MLM) and next sentence prediction (NSP) followed by a fine-tuning process on downstream tasks. Prompt-learning instead reconstructs the pretraining to embed the downstream task, encouraging the model to implicitly learn the desired task. The use of prompt-learning in a clinical domain has not been documented yet, thus provides a great opportunity.The proposed new methodologies will be developed and implemented in consultation with clinicians and will address real clinical use-cases. Specifically, the language models will be trained on a large collection of free-text notes from secondary care UKCRIS database to help triage patients to specialist teams. Other strands will explore the feasibility of identifying patients for clinical trials and identification of self-harm. The feasibility of translation of the developed methodology and models will be tested beyond the scope of mental health under the support provided by the EPSRC CDT in Health Data Science.This project falls within the EPSRC healthcare technologies research area.
该项目的主要目的是利用自然语言处理(NLP)的最新进展来开发端到端的临床支持系统,该系统可以利用电子健康记录(EHR)中的纵向自由文本文档。EHR通常包含与患者和医疗服务之间的所有交互有关的历史记录,包括自由文本文档,例如转诊信和出院记录。一个值得注意的挑战是能够充分捕获临床文本的纵向表示。常见的最先进的模型,诸如来自变压器的双向编码器表示(BERT),只能处理512个令牌的序列(Devlin等人,2018),但单个患者一年的临床文本可能包含超过10,000个代币。另一个更普遍的问题涉及大型语言模型的透明性、可解释性和算法公平性。因此,该项目旨在开发方法和协议来增强这些方面。一种提出的表示顺序自由文本的方法建立在路径的签名上,这是一种以张量形式从数据中提取特征的非参数方法(Chevyrev和Kormilitzin,2016)。不严格地说,签名是关于数据流的统计数据的集合,这些数据是时不变的,并且具有普遍的非线性,因此足以捕获原始数据的所有可能的非线性函数:允许一种独特的方法来表示复杂的序列数据。将签名技术与策略相结合,以解决常见的基于Transformer的模型中注意力机制的有限能力,例如备用注意力机制(Zaheer等人,2020年)。这种混合方法应该允许有效的计算和表示患者的临床文本历史,可用于许多相关的下游tasks.Another方法将拥抱一个新的范式转变,在NLP研究,命名为自动学习。传统的下游任务处理方法包括采用一个模型,例如在掩蔽语言模型(MLM)和下一句预测(NSP)上预先训练的BERT,然后对下游任务进行微调。相反,主动学习重构预训练以嵌入下游任务,鼓励模型隐式学习所需的任务。在临床领域中使用自动学习还没有记录,因此提供了一个很好的机会。拟议的新方法将在与临床医生协商后开发和实施,并将解决真实的临床用例。具体来说,语言模型将在二级护理UKCRIS数据库的大量自由文本笔记上进行训练,以帮助将患者分类到专家团队。其他股将探讨确定临床试验和自我伤害的识别患者的可行性。在EPSRC健康数据科学CDT的支持下,将在心理健康范围之外测试所开发的方法和模型的可行性。该项目属于EPSRC医疗保健技术研究领域的福尔斯。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

5'-tRF-GlyGCC通过SRSF1调控RNA可变剪切促三阴性乳腺癌作用机制及干预策略
  • 批准号:
    82372743
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
脊髓电刺激活化Na(V)1.1阳性GABA神经元持续缓解癌痛
  • 批准号:
    82371223
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
丁酸梭菌代谢物(如丁酸、苯乳酸)通过MYC-TYMS信号轴影响结直肠癌化疗敏感性的效应及其机制研究
  • 批准号:
    82373139
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
均相液相生物芯片检测系统的构建及其在癌症早期诊断上的应用
  • 批准号:
    82372089
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
靶向PARylation介导的DNA损伤修复途径在恶性肿瘤治疗中的作用与分子机制研究
  • 批准号:
    82373145
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于密度泛函理论金原子簇放射性药物设计、制备及其在肺癌诊疗中的应用研究
  • 批准号:
    82371997
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
BRPF1 m6A修饰异常通过重塑BCAT1超级增强子介导Setd2缺陷型肾癌支链氨基酸代谢成瘾的机制研究
  • 批准号:
    82372724
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于影像代谢重塑可视化的延胡索酸水合酶缺陷型肾癌危险性分层模型的研究
  • 批准号:
    82371912
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
DRAM1与VAMP8相互作用调控自噬融合以促进肺癌细胞血管外渗的分子机制研究
  • 批准号:
    32000523
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
SAMMSON-CARF-p53信号轴调控黑色素瘤适应性耐药的机制研究
  • 批准号:
    32000541
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

AI-Powered Uncovering of Mechanisms in Cancer Through Causal Discovery Analysis and Generative Modeling of Heterogeneous Data
人工智能通过因果发现分析和异构数据生成模型揭示癌症机制
  • 批准号:
    10581180
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Molecular engineering and systematic evaluation of bispecific aptamers to develop potent and efficacious therapies for the immunomodulation of Non-Small Cell Lung Cancer
双特异性适体的分子工程和系统评估,以开发有效的非小细胞肺癌免疫调节疗法
  • 批准号:
    10751309
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
The roles of p53 and MYC dynamics in regulating heterogeneous cell fate responses to genotoxic stress
p53和MYC动力学在调节基因毒性应激的异质细胞命运反应中的作用
  • 批准号:
    10635353
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Sorting and characterization of mechanically heterogeneous cell populations based on cellular contractility
基于细胞收缩性的机械异质细胞群的分类和表征
  • 批准号:
    10728070
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Regulation and impact of alternative splicing in biology and disease
选择性剪接在生物学和疾病中的调控和影响
  • 批准号:
    10405870
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Full-length sequencing of individual RNAs from heterogeneous samples
对异质样品中的单个 RNA 进行全长测序
  • 批准号:
    10482321
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
MiR-152/PKM2/SLC7A5 axis in breast cancer development, chemo- and radiation-treatment response
MiR-152/PKM2/SLC7A5 轴在乳腺癌发展、化疗和放疗反应中的作用
  • 批准号:
    10593136
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Regulation and impact of alternative splicing in biology and disease
选择性剪接在生物学和疾病中的调控和影响
  • 批准号:
    10680397
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Regulation and impact of alternative splicing in biology and disease
选择性剪接在生物学和疾病中的调控和影响
  • 批准号:
    10833336
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Heterogeneous data fusion and machine learning for image understanding in lung cancer
用于肺癌图像理解的异构数据融合和机器学习
  • 批准号:
    RGPIN-2020-06498
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了