Tools for Ontology Annotation: dcGO

本体标注工具:dcGO

基本信息

  • 批准号:
    BB/L018543/1
  • 负责人:
  • 金额:
    $ 10.07万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2014
  • 资助国家:
    英国
  • 起止时间:
    2014 至 无数据
  • 项目状态:
    已结题

项目摘要

The massive amount of biological data, especially sequenced genomes and their end-product protein sequences, poses a prohibitive challenge for humans to manually cross-reference in literature. The solution is to use ontologies - controlled vocabularies - so that computer systems can process and connect rational relationships that are also readable by humans. The most used ontology is Gene Ontology (GO) that intends to describe protein functions.The most used resource for GO is UniProt. It provides protein sequence and functional annotation. GO annotations for proteins have two main types of evidence: one from experimental or curated annotations, the other from IEA (Inferred Electronic Annotations). IEA comes mostly from an InterPro mapping. InterPro is an integrated database that combines protein domains (or precisely signatures) from diverse sources with different definitions. In InterPro, annotations for domains are hand-curated via homology. Recently, we have pioneered a methodology in pursuit of a fully-automated tool: domain-centric Gene Ontology (dcGO). dcGO is the only freely available fully-automated general methodology for domain-based GO annotation. Thanks to its automated nature, dcGO is much more extensive than the InterPro hand curation. By comparison, we have shown that the quality of dcGO is at least as good as InterPro in terms of function predictions of proteins in UniProt. Therefore, extending dcGO to InterPro will have a considerable downstream impact on the UniProt IEA coverage and quality which is what scientists from around the world are routinely using as their primary source of annotation. In addition to GO, we will also provide domain annotations using other biomedical ontologies such as those describing diseases and phenotypes. For these kinds of annotations, currently only the dcGO approach can be extended in this way in a straightforward manner. In CAFA, a community-based critical assessment of protein function prediction, dcGO has been demonstrated for use in automated function annotation. In the next CAFA, we will prove that dcGO is also the suitable baseline for other ontologies and thus for inclusion in InterPro and UniProt. To meet the user requests for analysing sequences as a whole, we will also provide ontology enrichment analysis that will allow the users to understand which functions (and other relevant knowledge) are overrepresented in sequences submitted. This user-driven tool will be implemented in a computationally efficient way; the required will be on the order of seconds or minutes, rather than hours or days. In summary, the proposed research will be undertaken with a tight link to InterProt, UniProt, CAFA and end-users, and these collaborative connections will help translate our domain-centric solution into the industry standard for annotating and analyzing genome sequences.
海量的生物数据,特别是测序的基因组及其最终产物蛋白质序列,给人类在文献中手动交叉参考带来了令人望而却步的挑战。解决方案是使用本体论控制的词汇,这样计算机系统就可以处理和连接人类也可以阅读的理性关系。目前最常用的本体是描述蛋白质功能的基因本体(GO),而GO最常用的资源是UniProt。它提供了蛋白质序列和功能注释。蛋白质的GO注释有两种主要类型的证据:一种来自实验或策划的注释,另一种来自IEA(推断电子注释)。IEA主要来自InterPro的映射。InterPro是一个集成的数据库,它结合了来自不同来源的具有不同定义的蛋白质结构域(或准确地说是签名)。在InterPro中,域的注释是通过同源手动管理的。最近,我们开创了一种方法论,追求一种全自动化的工具:以领域为中心的基因本体论(DcGO)。DcGO是唯一免费提供的基于域的围棋注释的全自动通用方法。由于其自动化的性质,dcGO比InterPro的手部管理要广泛得多。通过比较,我们已经表明,在UniProt中蛋白质的功能预测方面,dcGO的质量至少与InterPro一样好。因此,将dcGO扩展到InterPro将对UniProt IEA的覆盖范围和质量产生相当大的下游影响,而这正是来自世界各地的科学家经常使用的主要注释来源。除了围棋,我们还将使用其他生物医学本体提供领域注释,例如那些描述疾病和表型的本体。对于这些类型的注释,目前只有dcGO方法可以以这种直接的方式进行扩展。在CAFA中,一个基于社区的蛋白质功能预测的关键评估dcGO已经被证明用于自动功能注释。在下一届CAFA中,我们将证明dcGO也是其他本体的合适基线,从而可以包含在InterPro和UniProt中。为了满足用户对整体序列分析的要求,我们还将提供本体丰富分析,让用户了解哪些功能(和其他相关知识)在提交的序列中被过度表达。这个用户驱动的工具将以计算高效的方式实施;所需的时间将在几秒钟或几分钟的数量级上,而不是几小时或几天。总之,拟议的研究将与InterProt、UniProt、CAFA和最终用户紧密联系在一起,这些合作联系将有助于将我们以领域为中心的解决方案转化为注释和分析基因组序列的行业标准。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An integrative approach to predicting the functional effects of non-coding and coding sequence variation.
一种预测非编码和编码序列变化的功能效应的综合方法。
  • DOI:
    10.1093/bioinformatics/btv009
  • 发表时间:
    2015-05-15
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shihab HA;Rogers MF;Gough J;Mort M;Cooper DN;Day IN;Gaunt TR;Campbell C
  • 通讯作者:
    Campbell C
Splice junctions are constrained by protein disorder.
  • DOI:
    10.1093/nar/gkv407
  • 发表时间:
    2015-05-26
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Smithers B;Oates ME;Gough J
  • 通讯作者:
    Gough J
Function-selective domain architecture plasticity potentials in eukaryotic genome evolution.
  • DOI:
    10.1016/j.biochi.2015.05.003
  • 发表时间:
    2015-12
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Linkeviciute V;Rackham OJ;Gough J;Oates ME;Fang H
  • 通讯作者:
    Fang H
The 'dnet' approach promotes emerging research on cancer patient survival.
  • DOI:
    10.1186/s13073-014-0064-8
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    12.3
  • 作者:
    Fang H;Gough J
  • 通讯作者:
    Gough J
The `dnet¿ approach promotes emerging research on cancer patient survival
“dnet”方法促进癌症患者生存的新兴研究
  • DOI:
    10.1186/preaccept-1248435140128963
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    12.3
  • 作者:
    Fang H
  • 通讯作者:
    Fang H
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Julian Gough其他文献

2016). Evolution of the calcium-based intracellular signalling system. Genome Biology and Evolution
2016)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Marchadier;Matt E. Oates;Hai Fang;Philip Donoghue;Alistair M. Hetherington;Julian Gough
  • 通讯作者:
    Julian Gough

Julian Gough的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Julian Gough', 18)}}的其他基金

SUPERFAMILY
超级家庭
  • 批准号:
    BB/N019431/2
  • 财政年份:
    2017
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant
SUPERFAMILY
超级家庭
  • 批准号:
    BB/N019431/1
  • 财政年份:
    2016
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant
Prediction of Factors to Induce Cell Differentiation
诱导细胞分化的因素预测
  • 批准号:
    BB/I025018/1
  • 财政年份:
    2011
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant
GENOME-3D: a UK network providing structure-based annotations for genotype to phenotype studies
GENOME-3D:英国网络,为基因型到表型研究提供基于结构的注释
  • 批准号:
    BB/I02500X/1
  • 财政年份:
    2011
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant
Support for the SUPERFAMILY protein domain resource.
支持 SUPERFAMILY 蛋白质域资源。
  • 批准号:
    BB/G022771/1
  • 财政年份:
    2010
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant

相似国自然基金

农业数字防灾减灾资源规划机理分析与系统实现:基于EA和Ontology的研究
  • 批准号:
    71363044
  • 批准年份:
    2013
  • 资助金额:
    34.0 万元
  • 项目类别:
    地区科学基金项目
基于Ontology的藏文语料库检索关键技术研究
  • 批准号:
    61262053
  • 批准年份:
    2012
  • 资助金额:
    45.0 万元
  • 项目类别:
    地区科学基金项目
基于Geo-Ontology的地理信息智能服务关键技术
  • 批准号:
    41271392
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
农业Ontology的构建和转化研究
  • 批准号:
    70573116
  • 批准年份:
    2005
  • 资助金额:
    17.0 万元
  • 项目类别:
    面上项目
基于Ontology的自然语言描述的空间概念三维可视化研究
  • 批准号:
    60575041
  • 批准年份:
    2005
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目
面向特定领域基于Ontology的跨语言信息检索技术研究
  • 批准号:
    60302021
  • 批准年份:
    2003
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
面向语义Web的Ontology计算与语义推理技术研究
  • 批准号:
    60363006
  • 批准年份:
    2003
  • 资助金额:
    7.0 万元
  • 项目类别:
    地区科学基金项目
基于Ontology案例推理隐性知识管理系统及在知识创新型组织的应用
  • 批准号:
    70201009
  • 批准年份:
    2002
  • 资助金额:
    13.0 万元
  • 项目类别:
    青年科学基金项目
基于ontology语义信息的半结构化数据管理方法研究
  • 批准号:
    60172012
  • 批准年份:
    2001
  • 资助金额:
    15.0 万元
  • 项目类别:
    面上项目

相似海外基金

Investigation of Ontology-Style Relation Annotation and Its Effects with Deep Learning
深度学习本体式关系标注及其效果研究
  • 批准号:
    20K11942
  • 财政年份:
    2020
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Ontology of Qualities for the Annotation of Biomedical Data
生物医学数据注释的质量本体论
  • 批准号:
    8127993
  • 财政年份:
    2009
  • 资助金额:
    $ 10.07万
  • 项目类别:
An Ontology of Qualities for the Annotation of Biomedical Data
生物医学数据注释的质量本体论
  • 批准号:
    8515730
  • 财政年份:
    2009
  • 资助金额:
    $ 10.07万
  • 项目类别:
An Ontology of Qualities for the Annotation of Biomedical Data
生物医学数据注释的质量本体论
  • 批准号:
    7559228
  • 财政年份:
    2009
  • 资助金额:
    $ 10.07万
  • 项目类别:
An Ontology of Qualities for the Annotation of Biomedical Data
生物医学数据注释的质量本体论
  • 批准号:
    7945326
  • 财政年份:
    2009
  • 资助金额:
    $ 10.07万
  • 项目类别:
Integrating Microarray and Proteomic Data by Ontology-based Annotation
通过基于本体的注释整合微阵列和蛋白质组数据
  • 批准号:
    8138486
  • 财政年份:
    2008
  • 资助金额:
    $ 10.07万
  • 项目类别:
Integrating Microarray and Proteomic Data by Ontology-based Annotation
通过基于本体的注释整合微阵列和蛋白质组数据
  • 批准号:
    7693803
  • 财政年份:
    2008
  • 资助金额:
    $ 10.07万
  • 项目类别:
Integrating Microarray and Proteomic Data by Ontology-based Annotation
通过基于本体的注释整合微阵列和蛋白质组数据
  • 批准号:
    7929664
  • 财政年份:
    2008
  • 资助金额:
    $ 10.07万
  • 项目类别:
Further development of the QuickGO web interface for browsing and retrieving Gene Ontology Annotation data
进一步开发 QuickGO Web 界面,用于浏览和检索基因本体注释数据
  • 批准号:
    BB/E023541/1
  • 财政年份:
    2007
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Research Grant
Microbial Genome Sequencing: Gene Ontology Terms for Standardized Annotation of Plant-Associated Microbe Genomes
微生物基因组测序:植物相关微生物基因组标准化注释的基因本体术语
  • 批准号:
    0523736
  • 财政年份:
    2005
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了