Heuristics to evaluate biomedical and genomic knowledge bases for validity

启发式评估生物医学和基因组知识库的有效性

基本信息

  • 批准号:
    9765396
  • 负责人:
  • 金额:
    $ 48万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-15 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Project Summary Our overarching goal is to understand how information characterizing genes and their function can be organized, integrated, and then generalized to new contexts. This is a central question of the post-genomic era, and one that becomes ever more pressing as novel assays expand the scope, breadth, and detail of information describing gene properties. While the Gene Ontology is the most prominent and universal system for organizing gene function, hundreds of others exist, often serving specialized research interests. Most laboratories depend on the validity of some subset of this data to design new experiments or interpret their results, but their quality is hard to directly ascertain, particularly in novel or complex integrative methodologies. Based on substantial preliminary data, we hypothesize that determining robustness and specificity will provide a highly general assessment of the utility of databases. We propose to use these properties to assess the entire corpus of resources organizing gene information, as well as the methods which exploit this information, and the results that they report. Critically, determining robustness and specificity does not require validation with respect to ‘gold standard’ information. By evaluating these resources with respect to their joint specificity and robustness we determine means of integrating and organizing their data for use in novel applications. Finally, we propose to apply our improvements in quality control to better target rare but robust results where this is an experimental goal, notably rare diseases and single cell expression. The three complementary objectives in this project are to: 1. Determine the uniqueness and robustness of data characterizing gene function. We develop a formal approach for characterizing robustness and uniqueness/specificity by exploiting prior probability in the form of gene multifunctionality. We will evaluate robustness and specificity across essentially all complex and structured databases characterizing genes. These measures can be compared between databases or over time and provide a global landscape of data structure. 2. Test methods designed to exploit information describing gene function. Statistical and machine learning methods exploiting structured data will be assessed for robust and specific output. Data features driving performance in diverse applications will be identified and complementary sources of data as well as community clusters will be defined. 3. Evaluate results that depended on the use of databases describing gene function. Using a combination of text-mining and figure-mining, we will assess the ongoing literature for novel, robust, and specific gene-function associations. We will characterize and evaluate the “dark matter” of gene-function association from both the point of unannotated genes as well as incomplete functions.
项目摘要 我们的首要目标是了解表征基因及其功能的信息是如何 组织、集成,然后概括到新的上下文。这是后基因组时代的中心问题, 随着新的分析方法扩大信息的范围、广度和细节,这一问题变得更加紧迫 描述基因特性。而基因本体论是最突出和最普遍的系统 在基因功能的组织方面,还存在着数百个其他组织,通常服务于专门的研究兴趣。多数 实验室依靠这些数据的某些子集的有效性来设计新的实验或解释它们的 结果,但其质量很难直接确定,特别是在新的或复杂的综合 方法论。基于大量的初步数据,我们假设确定稳健性和 具体情况将提供对数据库效用的高度概括性评估。我们建议使用这些 属性来评估组织基因信息的整个资源语料库,以及 利用这些信息,以及他们报告的结果。最重要的是,确定健壮性和特异性 不需要对“黄金标准”信息进行验证。通过从以下方面评估这些资源 它们共同的特殊性和稳健性决定了整合和组织它们的数据以用于 新颖的应用。最后,我们建议将我们在质量控制方面的改进应用于更好地针对稀有但 这是一个实验目标,特别是罕见疾病和单细胞表达。 该项目的三个相辅相成的目标是: 1.确定表征基因功能的数据的唯一性和稳健性。我们开发了一种 一种通过利用先验概率来表征稳健性和唯一性/特异性的形式化方法 基因多功能的形式。我们将评估基本上所有复杂和特定的 描述基因的结构化数据库。可以在数据库之间或在一段时间内比较这些度量 并提供数据结构的全球格局。 2.旨在利用描述基因功能的信息的测试方法。统计与机器 利用结构化数据的学习方法将被评估为稳健和具体的输出。数据功能 将确定不同应用程序中的驱动性能,并补充数据来源以及 将定义社区集群。 3.评估依赖于描述基因功能的数据库的使用的结果。使用 结合文本挖掘和图形挖掘,我们将评估正在进行的新奇、健壮和 特定的基因-功能关联。我们将对基因功能的“暗物质”进行表征和评估 从未注释的基因和不完整的功能两个角度进行关联。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jesse Gillis其他文献

Jesse Gillis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jesse Gillis', 18)}}的其他基金

Scalable Molecular Pipelines for FAIR and Reusable BICAN Molecular Data
用于公平和可重复使用的 BICAN 分子数据的可扩展分子管道
  • 批准号:
    10686157
  • 财政年份:
    2022
  • 资助金额:
    $ 48万
  • 项目类别:
Scalable Molecular Pipelines for FAIR and Reusable BICAN Molecular Data
用于公平和可重复使用的 BICAN 分子数据的可扩展分子管道
  • 批准号:
    10523659
  • 财政年份:
    2022
  • 资助金额:
    $ 48万
  • 项目类别:
Revealing the transcriptomic basis of neuronal identity through functional meta-analysis
通过功能荟萃分析揭示神经元身份的转录组学基础
  • 批准号:
    10224662
  • 财政年份:
    2017
  • 资助金额:
    $ 48万
  • 项目类别:
Single-Cell Biology Shared Resource
单细胞生物学共享资源
  • 批准号:
    10675645
  • 财政年份:
    1997
  • 资助金额:
    $ 48万
  • 项目类别:
Single-Cell Biology Shared Resource
单细胞生物学共享资源
  • 批准号:
    10270226
  • 财政年份:
    1997
  • 资助金额:
    $ 48万
  • 项目类别:

相似海外基金

RII Track-4:NSF: From the Ground Up to the Air Above Coastal Dunes: How Groundwater and Evaporation Affect the Mechanism of Wind Erosion
RII Track-4:NSF:从地面到沿海沙丘上方的空气:地下水和蒸发如何影响风蚀机制
  • 批准号:
    2327346
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Standard Grant
BRC-BIO: Establishing Astrangia poculata as a study system to understand how multi-partner symbiotic interactions affect pathogen response in cnidarians
BRC-BIO:建立 Astrangia poculata 作为研究系统,以了解多伙伴共生相互作用如何影响刺胞动物的病原体反应
  • 批准号:
    2312555
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Standard Grant
How Does Particle Material Properties Insoluble and Partially Soluble Affect Sensory Perception Of Fat based Products
不溶性和部分可溶的颗粒材料特性如何影响脂肪基产品的感官知觉
  • 批准号:
    BB/Z514391/1
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Training Grant
Graduating in Austerity: Do Welfare Cuts Affect the Career Path of University Students?
紧缩毕业:福利削减会影响大学生的职业道路吗?
  • 批准号:
    ES/Z502595/1
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Fellowship
Insecure lives and the policy disconnect: How multiple insecurities affect Levelling Up and what joined-up policy can do to help
不安全的生活和政策脱节:多种不安全因素如何影响升级以及联合政策可以提供哪些帮助
  • 批准号:
    ES/Z000149/1
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Research Grant
感性個人差指標 Affect-X の構築とビスポークAIサービスの基盤確立
建立个人敏感度指数 Affect-X 并为定制人工智能服务奠定基础
  • 批准号:
    23K24936
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
How does metal binding affect the function of proteins targeted by a devastating pathogen of cereal crops?
金属结合如何影响谷类作物毁灭性病原体靶向的蛋白质的功能?
  • 批准号:
    2901648
  • 财政年份:
    2024
  • 资助金额:
    $ 48万
  • 项目类别:
    Studentship
ERI: Developing a Trust-supporting Design Framework with Affect for Human-AI Collaboration
ERI:开发一个支持信任的设计框架,影响人类与人工智能的协作
  • 批准号:
    2301846
  • 财政年份:
    2023
  • 资助金额:
    $ 48万
  • 项目类别:
    Standard Grant
Investigating how double-negative T cells affect anti-leukemic and GvHD-inducing activities of conventional T cells
研究双阴性 T 细胞如何影响传统 T 细胞的抗白血病和 GvHD 诱导活性
  • 批准号:
    488039
  • 财政年份:
    2023
  • 资助金额:
    $ 48万
  • 项目类别:
    Operating Grants
How motor impairments due to neurodegenerative diseases affect masticatory movements
神经退行性疾病引起的运动障碍如何影响咀嚼运动
  • 批准号:
    23K16076
  • 财政年份:
    2023
  • 资助金额:
    $ 48万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了