III: Small: Methods for Auditing and Enhancing Completeness of Ontologies

III:小:审计和增强本体完整性的方法

基本信息

项目摘要

An ontology is a formal representation of the knowledge by a set of concepts (terms) and the relationships between those concepts within a domain of specialty. Ontologies have been widely used for orchestrating the coding, management, exchange, and sharing of the increasingly large amounts of digital data produced by the biomedical research enterprise. For example, SNOMED CT, one of the largest and most complex biomedical ontologies, supports the development of high-quality electronic health records and facilitates patient subgroup identification, clinical decision support, and healthcare delivery quality measurement. Given such important roles that biomedical ontologies play, quality issues (such as incompleteness in coverage of subclasses), if not addressed, can affect the quality of diagnoses and decisions. However, incompleteness issues such as missing hierarchical relations and missing concepts are infeasible to be addressed by manual work alone due to the size and complexity of biomedical ontologies. The goal of this project is to develop automated and scalable approaches for identifying potential incompleteness issues as well as suggesting solutions to fix them. This project will incorporate the computational aspects of the proposed work into curriculum development and educational offerings related to data science and promote women participation in data science.To audit and enhance completeness of ontologies, this project explores the following research tasks: (1) Development of a robust reasoning framework for detecting and repairing missing subclass or hierarchical relations. This will result in suggestions that directly enhances the subclass completeness of ontologies; (2) Development of novel methods for identifying missing concepts and creating appropriate name labels for the identified missing concepts. This will result in enhancement in the concept completeness of ontologies; (3) Generation of supporting evidence for suggested solutions by leveraging rich extrinsic knowledge. For further verification of the robustness of the proposed approaches, domain experts will be involved in validation of the discovered incompleteness issues. The proposed approaches are applied to three large ontologies in biomedicine: SNOMED CT, Gene Ontology, and NCI Thesaurus. Suggested ontology changes will be communicated to the respective ontology owners for incorporation in subsequent versions. The project website will include further information about this project, and provide access to publications, software, datasets and curriculum material.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
本体是通过一组概念(术语)和专业领域内这些概念之间的关系对知识的正式表示。本体已被广泛用于编排编码、管理、交换和共享生物医学研究企业产生的越来越多的数字数据。例如,SNOMED CT是最大和最复杂的生物医学本体之一,它支持开发高质量的电子健康记录,并促进患者亚组识别、临床决策支持和医疗保健交付质量测量。鉴于生物医学本体扮演着如此重要的角色,如果不解决质量问题(如子类覆盖的不完整),可能会影响诊断和决策的质量。然而,由于生物医学本体的规模和复杂性,缺少层次关系和概念等不完备性问题无法通过单独的手工工作来解决。这个项目的目标是开发自动化和可伸缩的方法来识别潜在的不完整性问题,并建议解决方案来修复它们。该项目将把拟议工作的计算方面纳入与数据科学有关的课程制定和教育产品,并促进妇女参与数据科学。为了审计和增强本体的完整性,本项目探讨了以下研究任务:(1)开发一个健壮的推理框架,用于检测和修复缺失的子类或层次关系。这将产生直接增强本体子类完整性的建议;(2)开发识别缺失概念的新方法,并为识别的缺失概念创建适当的名称标签。这将增强本体的概念完整性;(3)利用丰富的外部知识为建议的解决方案生成支持性证据。为了进一步验证所提出方法的鲁棒性,领域专家将参与对所发现的不完整性问题的验证。提出的方法应用于生物医学中的三个大型本体:SNOMED CT、基因本体和NCI词库。建议的本体更改将传达给各自的本体所有者,以便在后续版本中合并。该项目的网站将包括有关该项目的进一步信息,并提供访问出版物、软件、数据集和课程材料。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Enhancing the Quality of Hierarchic Relations in the National Cancer Institute Thesaurus to Enable Faceted Query of Cancer Registry Data
  • DOI:
    10.1200/cci.19.00124
  • 发表时间:
    2020-05-06
  • 期刊:
  • 影响因子:
    4.2
  • 作者:
    Cui, Licong;Abeysinghe, Rashmie;Zhang, Guo-Qiang
  • 通讯作者:
    Zhang, Guo-Qiang
Leveraging Non-lattice Subgraphs to Audit Hierarchical Relations in NCI Thesaurus
利用非格子图审计 NCI 同义词库中的层次关系
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abeysinghe, Rashmie;Brooks, Michael A;Cui, Licong
  • 通讯作者:
    Cui, Licong
A lexical-based approach for exhaustive detection of missing hierarchical IS-A relations in SNOMED CT
一种基于词汇的方法,用于详尽检测 SNOMED CT 中缺失的分层 IS-A 关系
Web-based Interactive Visualization of Non-Lattice Subgraphs (WINS) in SNOMED CT.
SNOMED CT 中基于 Web 的非格子图 (WINS) 交互式可视化。
A Comparison of Exhaustive and Non-lattice-based Methods for Auditing Hierarchical Relations in Gene Ontology
基因本体中层次关系审计的穷举方法和非基于格的方法的比较
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abeysinghe, Rashmie;Zheng, Fengbo;Cui, Licong
  • 通讯作者:
    Cui, Licong
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Licong Cui其他文献

Identifying Sleep-Related Factors Associated with Cognitive Function in a Hispanics/Latinos Cohort: A Dual Random Forest Approach
识别西班牙裔/拉丁裔群体中与认知功能相关的睡眠相关因素:双随机森林方法
A community effort for automatic detection of postictal generalized EEG suppression in epilepsy
  • DOI:
    10.1186/s12911-020-01306-8
  • 发表时间:
    2020-12-24
  • 期刊:
  • 影响因子:
    3.800
  • 作者:
    Yejin Kim;Xiaoqian Jiang;Samden D. Lhatoo;Guo-Qiang Zhang;Shiqiang Tao;Licong Cui;Xiaojin Li;Robert D. Jolly;Luyao Chen;Michael Phan;Cung Ha;Marijane Detranaltes;Jiajie Zhang
  • 通讯作者:
    Jiajie Zhang
Ontology-guided Health Information Extraction, Organization, and Exploration
本体引导的健康信息提取、组织和探索
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Licong Cui
  • 通讯作者:
    Licong Cui
Leveraging pretrained language models for seizure frequency extraction from epilepsy evaluation reports
利用预训练语言模型从癫痫评估报告中提取发作频率
  • DOI:
    10.1038/s41746-025-01592-4
  • 发表时间:
    2025-04-14
  • 期刊:
  • 影响因子:
    15.100
  • 作者:
    Rashmie Abeysinghe;Shiqiang Tao;Samden D. Lhatoo;Guo-Qiang Zhang;Licong Cui
  • 通讯作者:
    Licong Cui
A Data Capture Framework for Large-scale Interventional Studies with Survey Workflow Management
具有调查工作流程管理的大规模干预研究的数据捕获框架
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shiqiang Tao;Ningzhou Zeng;Xi Wu;Wei Zhu;Xiaojin Li;Licong Cui;Guoqiang Zhang
  • 通讯作者:
    Guoqiang Zhang

Licong Cui的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Licong Cui', 18)}}的其他基金

CAREER: Advancing the Role of Ontologies for Data Science in Biomedicine
职业:推进数据科学本体在生物医学中的作用
  • 批准号:
    2047001
  • 财政年份:
    2021
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Continuing Grant
III: Small: Methods for Auditing and Enhancing Completeness of Ontologies
III:小:审计和增强本体完整性的方法
  • 批准号:
    1816805
  • 财政年份:
    2018
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
CRII: III: A Scalable Framework for Debugging Large Biological Ontologies
CRII:III:用于调试大型生物本体的可扩展框架
  • 批准号:
    1657306
  • 财政年份:
    2017
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Computational Methods for Multi-dimensional Data Integration to Improve Phenotype Prediction
III:小:多维数据集成的计算方法以改进表型预测
  • 批准号:
    2246796
  • 财政年份:
    2023
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: Comprehensive Methods to Learn to Augment Graph Data
III:小:学习增强图数据的综合方法
  • 批准号:
    2146761
  • 财政年份:
    2022
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    2053286
  • 财政年份:
    2020
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: Accessible and Interpretable Machine Reading Methods for Extracting Structured Information from Text
III:小:从文本中提取结构化信息的可访问且可解释的机器阅读方法
  • 批准号:
    2006583
  • 财政年份:
    2020
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Continuing Grant
III: Small: Computational Methods for Ancestry Inference In Genetics
III:小:遗传学中祖先推断的计算方法
  • 批准号:
    1909425
  • 财政年份:
    2019
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Explaining Unsupervised Learning: Combinatorial Optimization Formulations, Methods and Applications
III:小:协作研究:解释无监督学习:组合优化公式、方法和应用
  • 批准号:
    1908530
  • 财政年份:
    2019
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: Explaining Unsupervised Learning: Combinatorial Optimization Formulations, Methods and Applications
III:小:协作研究:解释无监督学习:组合优化公式、方法和应用
  • 批准号:
    1910306
  • 财政年份:
    2019
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Continuing Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    1813252
  • 财政年份:
    2019
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: Models and Methods for Simultaneous Genotyping and Phylogeny Inference from Single-Cell DNA Data
III:小型:根据单细胞 DNA 数据同时进行基因分型和系统发育推断的模型和方法
  • 批准号:
    1812822
  • 财政年份:
    2018
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Structured Methods for Multi-Task Learning
III:小:协作研究:多任务学习的结构化方法
  • 批准号:
    1908166
  • 财政年份:
    2018
  • 资助金额:
    $ 30.69万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了