Improving health data quality by assessing and enhancing semantic integrity
通过评估和增强语义完整性来提高健康数据质量
基本信息
- 批准号:10446586
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-07-01 至 2026-04-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
As terminologies change and are used over time by different entities, there can develop
changes and divergence in what the use of a single code or a set of codes represent. These
can range from adding a new, more special meaning, to a code set (e.g., adding another
possibility to codes whose meaning was first listed as a NEC (not elsewhere classified) code, to
a major version change (as in the transition from ICD-9CM to ICD-10CM), and to local adaption
(e.g. using a more general code to indicate a more specific condition by an institution.) Such
altering of the semantics of codes presents a challenge that can be termed representational
semantic integrity (RS integrity). If multiple codes or multiple combinations of codes can
represent the same phenotype, cohort identification or cohort variable assignment based on
the codes becomes problematic. As numerous research projects utilize large electronic health
record (EHR) datasets containing standardized terminology codes, violations of RS integrity
would be expected to propagate errors in subsequent analyses and findings. The proposed
project seeks to address the question: How to assess and improve RS integrity in
longitudinal and heterogenous EHR data using automated methods? We propose to
develop novel data driven methods to analyze the temporal pattern and the context of
EHR variables. Using ICD-9CM, ICD-10CM, CPT and SNOMED codes as our use cases, this
study will leverage very large, longitudinal, heterogenous datasets: the Clinical Data Warehouse
of the Veteran Administration (VA)’s national EHR system, the Cerner Real World Data (RWD)
and the EHR data repository from a large medical center at University of Alabama at
Birmingham (UAB). Our aims are: 1) Develop data-driven approaches to assess RS
integrity in longitudinal EHR data. We will develop statistical and deep learning models to
perform multivariate time-series analysis for the purpose of detecting aberrant signals in codes
in EHR records; 2) Develop data-driven approaches to improve RS integrity in longitudinal
EHR data. We will analyze the contexts of codes over time and across data sources using
embedding techniques and develop a semantic matching tool that generates semantic
equivalent clusters for data from different time periods and facilities; and 3) Validate the
assessment and improvement approaches on different coding sets and data sources. We
will also assess the impact on predicative modeling.
随着术语的变化,并随着时间的推移被不同的实体使用,
使用单一代码或一组代码所代表的变化和分歧。这些
范围可以从添加新的、更特殊的含义,到代码集(例如,添加另一
可能性的代码,其含义是第一次列为NEC(不属于其他地方分类)代码,以
重大版本变更(如从ICD-9 CM向ICD-10 CM的过渡),以及局部调整
(e.g.使用更通用的代码来指示机构的更具体的条件。等
改变代码的语义提出了一个挑战,可以称为代表性的
语义完整性(RS完整性)。如果多个代码或多个代码组合可以
代表相同的表型、队列识别或队列变量分配,
代码就成了问题。由于许多研究项目利用大型电子健康
包含标准化术语代码的EHR数据集,违反RS完整性
预计会在后续分析和调查结果中传播错误。拟议
该项目旨在解决这个问题:如何评估和提高遥感完整性,
纵向和异构EHR数据使用自动化的方法?我们建议
开发新的数据驱动的方法来分析时间模式和上下文
EHR变量。使用ICD-9 CM、ICD-10 CM、CPT和SNOMED代码作为我们的用例,
研究将利用非常大的纵向异构数据集:临床数据仓库
退伍军人管理局(VA)的国家EHR系统,Cerner真实的世界数据(RWD)
和来自亚拉巴马大学的一个大型医疗中心的EHR数据存储库,
伯明翰(UAB)。我们的目标是:1)开发数据驱动的方法来评估RS
纵向EHR数据的完整性。我们将开发统计和深度学习模型,
执行多变量时间序列分析,以检测代码中的异常信号
2)开发数据驱动的方法,以提高纵向RS完整性
EHR数据。我们将分析代码随时间的变化和跨数据源的上下文,
嵌入技术,并开发一个语义匹配工具,
来自不同时间段和设施的数据的等效聚类;以及3)
评估和改进不同编码集和数据源的方法。我们
还将评估对预测建模的影响。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
STUART James NELSON其他文献
STUART James NELSON的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('STUART James NELSON', 18)}}的其他基金
Improving health data quality by assessing and enhancing semantic integrity
通过评估和增强语义完整性来提高健康数据质量
- 批准号:
10651693 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
相似国自然基金
重大传染病防治关键技术研究-重大传染病防治关键技术研究-基于One Health的SFTS防治技术体系构建与应用
- 批准号:2025C02186
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
人兽共患病One Health防控决策路径研究
- 批准号:
- 批准年份:2024
- 资助金额:5.0 万元
- 项目类别:省市级项目
基于 One Health 策略的 mcr 阳性多重耐药
ST34 型沙门菌的流行传播机制及溯源研究
- 批准号:Y24H190002
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
西方饮食通过“肠道菌群-Rspo1”轴促进肥胖与肠道吸收的机制研究
- 批准号:82370845
- 批准年份:2023
- 资助金额:48.00 万元
- 项目类别:面上项目
基于One Health理念的人兽共患病防控决策机制及实施路径研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
One Health 导向下人畜共患病公共危机四维防控体系研究
- 批准号:2019JJ50277
- 批准年份:2019
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于时间序列Shapelets的u-Health心电图可解释早期分类研究
- 批准号:61702468
- 批准年份:2017
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
基于One Health理念建立动物职业暴露人群流感监测体系的研究
- 批准号:81473034
- 批准年份:2014
- 资助金额:60.0 万元
- 项目类别:面上项目
城镇居民亚健康状态的评价方法学及健康管理模式研究
- 批准号:81172775
- 批准年份:2011
- 资助金额:14.0 万元
- 项目类别:面上项目
完善城镇居民基本医疗保险的"基本医疗服务包"研究
- 批准号:70873131
- 批准年份:2008
- 资助金额:24.0 万元
- 项目类别:面上项目
相似海外基金
Improving reproductive population health through patient-oriented health policy and epidemiological research
通过以患者为中心的卫生政策和流行病学研究改善生殖人口健康
- 批准号:
467619 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Salary Programs
I-TRANSFER-HF: Improving TRansitions ANd OutcomeS for Heart FailurE Patients in Home Health CaRe: A Type 1 Hybrid Effectiveness Implementation Trial
I-TRANSFER-HF:改善家庭医疗保健中心力衰竭患者的过渡和结果:1 型混合有效性实施试验
- 批准号:
10714524 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Prediction of Asthma-related Outcomes with Genetic Ancestry-informed Lung Function Equations
利用遗传祖先信息的肺功能方程改善哮喘相关结果的预测
- 批准号:
10723861 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Recruitment, Engagement, and Access for Community Health Equity for BRAIN Next-Generation Human Neuroimaging Research and Beyond (REACH for BRAIN)
改善 BRAIN 下一代人类神经影像研究及其他领域的社区健康公平的招募、参与和获取 (REACH for BRAIN)
- 批准号:
10730955 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Sleep and AD Biomarkers: A Pilot RCT of Citicoline
改善睡眠和 AD 生物标志物:胞二磷胆碱的试点随机对照试验
- 批准号:
10585583 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Age- and Cause-Specific Under-Five Mortality Rates (ACSU5MR) by Systematically Accounting Measurement Errors to Inform Child Survival Decision Making in Low Income Countries
通过系统地核算测量误差来改善特定年龄和特定原因的五岁以下死亡率 (ACSU5MR),为低收入国家的儿童生存决策提供信息
- 批准号:
10585388 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Mitochondria-targeted antioxidant supplementation for improving age-related vascular dysfunction in older adults: the role of circulating factors
线粒体靶向抗氧化剂补充剂可改善老年人与年龄相关的血管功能障碍:循环因子的作用
- 批准号:
10606926 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Patient-Centered Decision-Making for Stress Urinary Incontinence Treatment in Older Men
改善老年男性压力性尿失禁治疗中以患者为中心的决策
- 批准号:
10729838 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving sleep and circadian functioning, daytime functioning, and well-being for midlife and older adults by improving patient memory for a transdiagnostic sleep and circadian treatment
通过改善患者对跨诊断睡眠和昼夜节律治疗的记忆,改善中年和老年人的睡眠和昼夜节律功能、日间功能和福祉
- 批准号:
10708424 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Improving Care Transitions and Self-care among Informal Caregivers of Hospitalized Older Adults through Digital Tools
通过数字工具改善住院老年人的非正式护理人员的护理过渡和自我护理
- 批准号:
10717633 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别: