Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
基本信息
- 批准号:8231171
- 负责人:
- 金额:$ 64.27万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-09-01 至 2014-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
DESCRIPTION (provided by applicant): Much of the clinical information required for accurate clinical research, active decision support, and broad-coverage surveillance is locked in text files in an electronic medical record (EMR). The only feasible way to leverage this information for translational science is to extract and encode the information using natural language processing (NLP). Over the last two decades, several research groups have developed NLP tools for clinical notes, but a major bottleneck preventing progress in clinical NLP is the lack of standard, annotated data sets for training and evaluating NLP applications. Without these standards, individual NLP applications abound without the ability to train different algorithms on standard annotations, share and integrate NLP modules, or compare performance. We propose to develop standards and infrastructure that can enable technology to extract scientific information from textual medical records, and we propose the research as a collaborative effort involving NLP experts across the U.S. To accomplish this goal, we will address three specific aims: Aim 1: Extend existing standards and develop new consensus standards for annotating clinical text in a way that is interoperable, extensible, and usable. Aim 2: Apply existing methods and tools, and develop new methods and tools where necessary for manually annotating a set of publicly available clinical texts in a way that is efficient and accurate. Aim 3: Develop a publicly available toolkit for automatically annotating clinical text and perform a shared evaluation to evaluate the toolkit, using evaluation metrics that are multidimensional and flexible.
PUBLIC HEALTH RELEVANCE: In this project, we will develop a publicly available corpus of annotated clinical texts for NLP research. We will experiment with methods for increasing the efficiency of annotation and will annotate de-identified reports of nine types for linguistic and clinical information. In addition, we will create an NLP toolkit that can be shared and will evaluate it against other NLP systems in a shared task evaluation with the community.
描述(由申请人提供):准确的临床研究,主动决策支持和宽覆盖监视所需的许多临床信息都锁定在电子病历(EMR)中的文本文件中。利用这些信息用于转化科学的唯一可行方法是使用自然语言处理(NLP)提取和编码信息。在过去的二十年中,几个研究小组为临床注释开发了NLP工具,但是防止临床NLP进展的主要瓶颈是缺乏用于培训和评估NLP应用程序的标准,注释的数据集。没有这些标准,各个NLP应用程序就有很多,而没有能够在标准注释,共享和集成NLP模块或比较性能上训练不同算法的能力。我们建议开发标准和基础设施,以使技术能够从文本医疗记录中提取科学信息,我们将这项研究作为一项协作努力,涉及美国各地的NLP专家以实现这一目标,我们将解决三个具体的目标:AIM 1:扩展现有标准,扩展现有标准,并在某种程度上开发新的共识标准,以互动,可互动,并且可以互动,并且可以互动,并且可以使用。目标2:应用现有的方法和工具,并在必要时开发新的方法和工具,以便以高效和准确的方式手动注释一组公开可用的临床文本。 AIM 3:开发一个公开可用的工具包,用于自动注释临床文本,并使用多维且灵活的评估指标进行共享评估以评估工具包。
公共卫生相关性:在这个项目中,我们将开发出公开可用的NLP研究临床文本语料库。我们将尝试提高注释效率的方法,并注释九种类型的语言和临床信息的识别报告。此外,我们将创建一个可以共享的NLP工具包,并将与社区共享任务评估中的其他NLP系统对其进行评估。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
WENDY W. CHAPMAN其他文献
WENDY W. CHAPMAN的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('WENDY W. CHAPMAN', 18)}}的其他基金
University of Utah Interdisciplinary Training Program in Computational Approaches to Diabetes and Metabolism Research
犹他大学糖尿病和代谢研究计算方法跨学科培训项目
- 批准号:
9183480 - 财政年份:2016
- 资助金额:
$ 64.27万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8022026 - 财政年份:2011
- 资助金额:
$ 64.27万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8714052 - 财政年份:2011
- 资助金额:
$ 64.27万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8333306 - 财政年份:2011
- 资助金额:
$ 64.27万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8288078 - 财政年份:2010
- 资助金额:
$ 64.27万 - 项目类别:
Annotation, development and evaluation for clinical information extraction (transfer)
临床信息提取(传输)的注释、开发和评估
- 批准号:
8868500 - 财政年份:2010
- 资助金额:
$ 64.27万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8501543 - 财政年份:2010
- 资助金额:
$ 64.27万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8133360 - 财政年份:2010
- 资助金额:
$ 64.27万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
7985218 - 财政年份:2010
- 资助金额:
$ 64.27万 - 项目类别:
NLP Foundational Studies & Ontologies for Syndromic Surveillance from ED Reports
NLP基础研究
- 批准号:
7908086 - 财政年份:2009
- 资助金额:
$ 64.27万 - 项目类别:
相似国自然基金
新发展格局背景下参与全球价值链对中国制造业空间集聚的影响机制、效应评估及政策研究
- 批准号:42301202
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于省域协同发展视角的电价交叉补贴优化设计、效果评估和调控机制研究
- 批准号:72304237
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于分工视角的不同生产服务主体响应行为与农业生产性服务高质量发展:作用机理、效果评估及政策优化
- 批准号:72373101
- 批准年份:2023
- 资助金额:41 万元
- 项目类别:面上项目
多维行为偏好的非参数前沿评估建模及其在高技术产业绿色发展应用
- 批准号:72301145
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于慢性病病程发展的医疗保险跨部门补偿的政策评估和优化研究
- 批准号:72304054
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Evaluating the Impact of Mutations in Distant-Acting Enhancers in Structural Birth Defects
评估远效增强子突变对结构性出生缺陷的影响
- 批准号:
10826564 - 财政年份:2023
- 资助金额:
$ 64.27万 - 项目类别:
Machine learning-based methods for the analysis of microbial glycomes and proteomes in inflammatory bowel disease.
基于机器学习的方法,用于分析炎症性肠病中微生物糖组和蛋白质组。
- 批准号:
10591842 - 财政年份:2023
- 资助金额:
$ 64.27万 - 项目类别:
Core B: Statistical and Computational Analysis Core
核心B:统计和计算分析核心
- 批准号:
10698077 - 财政年份:2022
- 资助金额:
$ 64.27万 - 项目类别:
MetaboQuest: A Suite of Tools for Metabolite Annotation
MetaboQuest:代谢物注释工具套件
- 批准号:
10570907 - 财政年份:2022
- 资助金额:
$ 64.27万 - 项目类别:
Using Machine Learning to find a life saving needle in a haystack of children's emergencies
利用机器学习在儿童紧急情况的大海捞针中找到救生针
- 批准号:
10815094 - 财政年份:2022
- 资助金额:
$ 64.27万 - 项目类别: