The Metadata Powerwash - Integrated tools to make biomedical data FAIR
Metadata Powerwash - 使生物医学数据公平的集成工具
基本信息
- 批准号:10551273
- 负责人:
- 金额:$ 33.45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-05-01 至 2025-01-31
- 项目状态:未结题
- 来源:
- 关键词:AccelerationAgeBiological Specimen BanksCollectionCommon Data ElementCommunitiesComputersDataData CollectionData ScienceData SetDiseaseFAIR principlesFunding AgencyGoalsInformation TechnologyKnowledgeLibrariesLinkManualsMetadataMethodsNamesNatural Language ProcessingNumerical valueOntologyPharmaceutical PreparationsProcessRecordsReportingReproducibilityResearchResearch PersonnelResourcesRetrievalSamplingScienceScientistSpecific qualifier valueSpeedStandardizationStructureTechnologyTestingTimeVariantWorkbiomedical scientistdata archivedata repositorydata reuseexperimental studyimprovedindexinginformation organizationinteroperabilitymetadata standardsplace fieldspublic repositoryrepositorysample collectionsearch enginesecondary analysistool
项目摘要
Project Summary
The metadata that describe scientific data are fundamental resources to enable (1) the
discovery and reuse of the data and (2) the reproducibility of the experiments that generated the
data in the first place. Metadata are essential for scientists to understand the associated data
and to reuse them, as well as for information technology to index the data, to make the data
available, and to provide filters for scientists to search for the corresponding datasets.
Currently, the scientific metadata hosted in public repositories suffer from multiple quality issues
that limit scientists’ ability to find and reuse the experimental datasets to which they refer. It can
take many weeks of a scientist’s time to identify a collection of datasets that fulfill specific
criteria when the data are so poorly described—and the majority of the process is necessarily
manual.
We propose to develop an end-to-end solution to standardize biomedical metadata with the
help of ontologies—data structures that define the terms in an application domain and the
relationships among them. There are hundreds of ontologies that provide standard terms for
use in biomedicine, and they are essential resources to make biomedical metadata
interoperable and reusable. Our approach also will build on the technology created by the
Center for Expanded Data Annotation and Retrieval (CEDAR), which offers a library of building
blocks and common data elements for defining computer-based metadata templates based on
community standards.
Our plan involves three specific aims. First, we will develop a method and tool to standardize
the multiple, ad hoc metadata field names that may appear in metadata to represent the same
type of information by replacing those field names with the field names used in standard
metadata templates or, if no appropriate template match is available, with terms from a relevant
ontology. Second, we will develop methods and tools to standardize different types of metadata
field values, for example, categorical values such as drugs or diseases, and numerical values
such as age, or sample collection date. Third, we will evaluate the speed, precision, and recall
of our metadata transformation pipeline—built out of the methods and tools to standardize field
names and values—on a large corpus of metadata that we will manually curate based on
existing public metadata. We will also carry out experiments to test the effect of the
standardized metadata when biomedical scientists perform dataset search in the context of their
work.
项目摘要
描述科学数据的元数据是基本的资源,能够(1)
数据的发现和再利用,以及(2)产生数据的实验的再现性。
数据首先。元数据对于科学家理解相关数据至关重要
并重新使用它们,以及信息技术来索引数据,使数据
提供,并为科学家提供过滤器,以搜索相应的数据集。
目前,托管在公共知识库中的科学元数据存在多种质量问题
这限制了科学家发现和重用他们所参考的实验数据集的能力。它可以
科学家需要数周的时间来确定满足特定要求的数据集集合,
标准时,数据是如此糟糕的描述-和大部分的过程是必要的
手册.
我们建议开发一个端到端的解决方案,
本体论的帮助-定义应用程序域中术语的数据结构和
他们之间的关系。有数百种本体论为以下内容提供标准术语:
它们是制作生物医学元数据的重要资源
可互操作和可重用。我们的方法也将建立在由
扩展数据注释和检索中心(CEDAR),它提供了一个建筑物库,
块和公共数据元素,用于基于
社区标准。
我们的计划包括三个具体目标。首先,我们将开发一种方法和工具,
可能出现在元数据中的多个专用元数据字段名称表示相同的
通过将这些字段名替换为标准中使用的字段名,
元数据模板,或者如果没有合适的模板匹配,则使用相关
本体论第二,我们将开发方法和工具来标准化不同类型的元数据
字段值,例如,分类值(如药物或疾病)和数值
例如年龄或样品收集日期。第三,我们将评估速度,精度和召回率
我们的元数据转换管道-建立了方法和工具,以标准化领域
名称和值-在一个大型的元数据语料库上,我们将根据
公共元数据。我们亦会进行实验,以测试
当生物医学科学家在他们的环境中执行数据集搜索时,
工作
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mark A Musen其他文献
Mark A Musen的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mark A Musen', 18)}}的其他基金
Enhanced ontology engineering through a Web-based, Cloud-based software architecture
通过基于网络、云的软件架构增强本体工程
- 批准号:
10405968 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
The Metadata Powerwash - Integrated tools to make biomedical data FAIR
Metadata Powerwash - 使生物医学数据公平的集成工具
- 批准号:
10397981 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
Enhancing the RADx Data Hub for Data FAIRness
增强 RADx 数据中心以实现数据公平
- 批准号:
10433797 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
Enhancing the RADx Data Hub for Data FAIRness
增强 RADx 数据中心以实现数据公平
- 批准号:
10794704 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
Improved metadata authoring to enhance AI/ML readiness of associated datasets
改进元数据创作,以增强相关数据集的 AI/ML 准备情况
- 批准号:
10592638 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
BioPortal: An Expansive Knowledgebase of Biomedical Entities and Relations
BioPortal:生物医学实体和关系的广泛知识库
- 批准号:
10494104 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
BioPortal: An Expansive Knowledgebase of Biomedical Entities and Relations
BioPortal:生物医学实体和关系的广泛知识库
- 批准号:
10271048 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
Enhancing the RADx Data Hub for Data FAIRness
增强 RADx 数据中心以实现数据公平
- 批准号:
10699372 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
The Metadata Powerwash - Integrated tools to make biomedical data FAIR
Metadata Powerwash - 使生物医学数据公平的集成工具
- 批准号:
10093841 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
Enhancing the RADx Data Hub for Data FAIRness
增强 RADx 数据中心以实现数据公平
- 批准号:
10850055 - 财政年份:2021
- 资助金额:
$ 33.45万 - 项目类别:
相似国自然基金
靶向递送一氧化碳调控AGE-RAGE级联反应促进糖尿病创面愈合研究
- 批准号:JCZRQN202500010
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
对香豆酸抑制AGE-RAGE-Ang-1通路改善海马血管生成障碍发挥抗阿尔兹海默病作用
- 批准号:2025JJ70209
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
AGE-RAGE通路调控慢性胰腺炎纤维化进程的作用及分子机制
- 批准号:
- 批准年份:2024
- 资助金额:0 万元
- 项目类别:面上项目
甜茶抑制AGE-RAGE通路增强突触可塑性改善小鼠抑郁样行为
- 批准号:2023JJ50274
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
蒙药额尔敦-乌日勒基础方调控AGE-RAGE信号通路改善术后认知功能障碍研究
- 批准号:
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
补肾健脾祛瘀方调控AGE/RAGE信号通路在再生障碍性贫血骨髓间充质干细胞功能受损的作用与机制研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:面上项目
LncRNA GAS5在2型糖尿病动脉粥样硬化中对AGE-RAGE 信号通路上相关基因的调控作用及机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
围绕GLP1-Arginine-AGE/RAGE轴构建探针组学方法探索大柴胡汤异病同治的效应机制
- 批准号:81973577
- 批准年份:2019
- 资助金额:55.0 万元
- 项目类别:面上项目
AGE/RAGE通路microRNA编码基因多态性与2型糖尿病并发冠心病的关联研究
- 批准号:81602908
- 批准年份:2016
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
高血糖激活滑膜AGE-RAGE-PKC轴致骨关节炎易感的机制研究
- 批准号:81501928
- 批准年份:2015
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
相似海外基金
PROTEMO: Emotional Dynamics Of Protective Policies In An Age Of Insecurity
PROTEMO:不安全时代保护政策的情绪动态
- 批准号:
10108433 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
EU-Funded
The role of dietary and blood proteins in the prevention and development of major age-related diseases
膳食和血液蛋白在预防和发展主要与年龄相关的疾病中的作用
- 批准号:
MR/X032809/1 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Fellowship
Atomic Anxiety in the New Nuclear Age: How Can Arms Control and Disarmament Reduce the Risk of Nuclear War?
新核时代的原子焦虑:军控与裁军如何降低核战争风险?
- 批准号:
MR/X034690/1 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Fellowship
Collaborative Research: Resolving the LGM ventilation age conundrum: New radiocarbon records from high sedimentation rate sites in the deep western Pacific
合作研究:解决LGM通风年龄难题:西太平洋深部高沉降率地点的新放射性碳记录
- 批准号:
2341426 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Continuing Grant
Collaborative Research: Resolving the LGM ventilation age conundrum: New radiocarbon records from high sedimentation rate sites in the deep western Pacific
合作研究:解决LGM通风年龄难题:西太平洋深部高沉降率地点的新放射性碳记录
- 批准号:
2341424 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Continuing Grant
Doctoral Dissertation Research: Effects of age of acquisition in emerging sign languages
博士论文研究:新兴手语习得年龄的影响
- 批准号:
2335955 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Standard Grant
The economics of (mis)information in the age of social media
社交媒体时代(错误)信息的经济学
- 批准号:
DP240103257 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Discovery Projects
How age & sex impact the transcriptional control of mammalian muscle growth
你多大
- 批准号:
DP240100408 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Discovery Projects
Supporting teachers and teaching in the age of Artificial Intelligence
支持人工智能时代的教师和教学
- 批准号:
DP240100111 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Discovery Projects
Enhancing Wahkohtowin (Kinship beyond the immediate family) Community-based models of care to reach and support Indigenous and racialized women of reproductive age and pregnant women in Canada for the prevention of congenital syphilis
加强 Wahkohtowin(直系亲属以外的亲属关系)以社区为基础的护理模式,以接触和支持加拿大的土著和种族育龄妇女以及孕妇,预防先天梅毒
- 批准号:
502786 - 财政年份:2024
- 资助金额:
$ 33.45万 - 项目类别:
Directed Grant