Pattern mining from linked data, methods, tools and applications

从关联数据、方法、工具和应用程序中进行模式挖掘

基本信息

  • 批准号:
    249900-2013
  • 负责人:
  • 金额:
    $ 1.46万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2015
  • 资助国家:
    加拿大
  • 起止时间:
    2015-01-01 至 2016-12-31
  • 项目状态:
    已结题

项目摘要

This program is about extracting useful knowledge from the structured data that is published on the Web. It researches the adaptation of previously contributed methods and techniques for pattern mining to the emerging Web of Data, a cloud of Linked Open Data (LOD) datasets freely available on the Web for access/retrieval. The underlying format is the Resource Description Framework (RDF), a graph-based language. LOD datasets of the cloud, often with an explicit machine readable schema, are inter-linked into a virtually unique global graph which is constantly expanding (32 billion edges in 2011). Data mining within such a huge heterogeneous yet relatively well structured source is both beneficial and challenging: (1) the relational structure of a LOD dataset is hard to process for standard data miners and (2) the available schema knowledge need to be properly exploited to guide the mining process. Our program focuses on pattern mining, i.e., discovery of recurring regularities in data descriptions. The extracted patterns have a wide range of applications from schema refinement to recommendation to decision making in the domain. However, existing pattern miners fail in at least one of the three ways: flatten the graph into a feature vector and hence lose precious information for mining, ignore the schema knowledge or sacrify efficiency for expressiveness. We propose to research on a better trade-off between scalability, expressiveness and coverage of variable pattern languages for RDF datasets. The research will build upon mining methods designed to work with rich schemas (ontologies) albeit with a somewhat different input data and of smaller size. The key challenge is therefore to increase their scope and efficiency. To that end, we shall research on properly recasting them in terms of general data mining problems to enable the application of state-of-the-art data structures, techniques and structural results. The intended applications are analysis of drug adverse reactions (pharmacovigilance), decision making in critical care, design of complex workflows in phylogenetic analysis of genomic data.
这个程序是关于从发布在Web上的结构化数据中提取有用的知识。它研究了适应以前贡献的方法和技术的模式挖掘新兴的Web数据,云的链接开放数据(LOD)数据集在Web上免费访问/检索。底层格式是资源描述框架(RDF),一种基于图形的语言。云的LOD数据集通常具有显式的机器可读模式,它们相互链接成一个不断扩展的几乎唯一的全局图(2011年为320亿条边)。在这样一个巨大的异构但结构相对良好的数据源中进行数据挖掘是有益的,也是具有挑战性的:(1)LOD数据集的关系结构对于标准数据挖掘器来说很难处理,(2)需要适当地利用可用的模式知识来指导挖掘过程。我们的计划侧重于模式挖掘,即,发现数据描述中重复出现的错误。所提取的模式具有广泛的应用领域,从模式细化到推荐到决策。然而,现有的模式挖掘机失败的三种方式中的至少一种:扁平化的图到一个特征向量,从而失去了宝贵的信息挖掘,忽略了模式知识或表达效率低下。我们建议研究RDF数据集的可变模式语言的可扩展性,表达性和覆盖率之间的更好的权衡。这项研究将建立在挖掘方法的基础上,这些方法旨在处理丰富的模式(本体),尽管输入数据有所不同,而且规模较小。因此,关键的挑战是扩大其范围和效率。为此,我们将研究如何根据一般数据挖掘问题对其进行适当的重铸,以便能够应用最先进的数据结构、技术和结构结果。预期应用是药物不良反应分析(药物警戒)、重症监护决策、基因组数据系统发育分析中复杂工作流程的设计。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Valtchev, Petko其他文献

Bioinformatic Workflow Extraction from Scientific Texts based on Word Sense Disambiguation

Valtchev, Petko的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Valtchev, Petko', 18)}}的其他基金

Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
  • 批准号:
    249900-2013
  • 财政年份:
    2017
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
  • 批准号:
    249900-2013
  • 财政年份:
    2016
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
  • 批准号:
    249900-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
  • 批准号:
    249900-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
  • 批准号:
    249900-2006
  • 财政年份:
    2010
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
  • 批准号:
    249900-2006
  • 财政年份:
    2009
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
  • 批准号:
    249900-2006
  • 财政年份:
    2008
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
  • 批准号:
    249900-2006
  • 财政年份:
    2007
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
  • 批准号:
    249900-2006
  • 财政年份:
    2006
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
A complete methology for manipulating large-size Galois lattices and derived structures
操纵大尺寸伽罗瓦格子和派生结构的完整方法
  • 批准号:
    249900-2002
  • 财政年份:
    2005
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

基于Genome mining技术研究抑制表皮葡萄球菌生物膜形成的次级代谢产物
  • 批准号:
    21242003
  • 批准年份:
    2012
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目
在我们的门前发掘化石——利用中国即将开展的巡天来研究银河系的演化
  • 批准号:
    11043005
  • 批准年份:
    2010
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目
高维稀疏数据聚类研究
  • 批准号:
    70771007
  • 批准年份:
    2007
  • 资助金额:
    16.0 万元
  • 项目类别:
    面上项目
林火行为的动态模拟信息系统
  • 批准号:
    30371171
  • 批准年份:
    2003
  • 资助金额:
    17.0 万元
  • 项目类别:
    面上项目

相似海外基金

Viral Immunity and VAccination (VIVA) Human Immunology Project Consortium (HIPC)
病毒免疫和疫苗接种 (VIVA) 人类免疫学项目联盟 (HIPC)
  • 批准号:
    10435231
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
SCH: AI-Enhanced Multimodal Sensor-on-a-chip for Alzheimer's Disease Detection
SCH:用于阿尔茨海默病检测的人工智能增强型多模态芯片传感器
  • 批准号:
    10685378
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
Knowledge Graph Mining for the Linked Open Data Cloud
链接开放数据云的知识图挖掘
  • 批准号:
    RGPIN-2017-04031
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
SCH: AI-Enhanced Multimodal Sensor-on-a-chip for Alzheimer's Disease Detection
SCH:用于阿尔茨海默病检测的人工智能增强型多模态芯片传感器
  • 批准号:
    10437992
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
Viral Immunity and VAccination (VIVA) Human Immunology Project Consortium (HIPC)
病毒免疫和疫苗接种 (VIVA) 人类免疫学项目联盟 (HIPC)
  • 批准号:
    10595622
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
  • 批准号:
    10318416
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
  • 批准号:
    10668535
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
Knowledge Graph Mining for the Linked Open Data Cloud
链接开放数据云的知识图挖掘
  • 批准号:
    RGPIN-2017-04031
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
  • 批准号:
    10604891
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
Roles of the X-linked Intellectual Disability gene ZDHHC9 in White Matter formation
X连锁智力障碍基因ZDHHC9在白质形成中的作用
  • 批准号:
    10354435
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了