Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
基本信息
- 批准号:249900-2013
- 负责人:
- 金额:$ 1.46万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2014
- 资助国家:加拿大
- 起止时间:2014-01-01 至 2015-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This program is about extracting useful knowledge from the structured data that is published on the Web. It researches the adaptation of previously contributed methods and techniques for pattern mining to the emerging Web of Data, a cloud of Linked Open Data (LOD) datasets freely available on the Web for access/retrieval. The underlying format is the Resource Description Framework (RDF), a graph-based language. LOD datasets of the cloud, often with an explicit machine readable schema, are inter-linked into a virtually unique global graph which is constantly expanding (32 billion edges in 2011). Data mining within such a huge heterogeneous yet relatively well structured source is both beneficial and challenging: (1) the relational structure of a LOD dataset is hard to process for standard data miners and (2) the available schema knowledge need to be properly exploited to guide the mining process. Our program focuses on pattern mining, i.e., discovery of recurring regularities in data descriptions. The extracted patterns have a wide range of applications from schema refinement to recommendation to decision making in the domain. However, existing pattern miners fail in at least one of the three ways: flatten the graph into a feature vector and hence lose precious information for mining, ignore the schema knowledge or sacrify efficiency for expressiveness. We propose to research on a better trade-off between scalability, expressiveness and coverage of variable pattern languages for RDF datasets. The research will build upon mining methods designed to work with rich schemas (ontologies) albeit with a somewhat different input data and of smaller size. The key challenge is therefore to increase their scope and efficiency. To that end, we shall research on properly recasting them in terms of general data mining problems to enable the application of state-of-the-art data structures, techniques and structural results. The intended applications are analysis of drug adverse reactions (pharmacovigilance), decision making in critical care, design of complex workflows in phylogenetic analysis of genomic data.
这个程序是关于从发布在Web上的结构化数据中提取有用的知识。它研究了以前贡献的模式挖掘方法和技术对新兴的Web of Data的适应性,Web of Data是一种可在Web上免费获得的链接开放数据(LOD)数据集,可供访问/检索。底层格式是资源描述框架(RDF),这是一种基于图形的语言。云的LOD数据集通常具有显式的机器可读模式,它们相互链接到一个几乎唯一的全球图表中,该图表正在不断扩展(2011年有320亿条边)。在这样一个巨大的异质但结构相对良好的数据源中进行数据挖掘既是有益的,也是具有挑战性的:(1)LOD数据集的关系结构对于标准数据挖掘者来说是很难处理的,(2)需要适当地利用可用的模式知识来指导挖掘过程。我们的程序专注于模式挖掘,即发现数据描述中的递归规则。所提取的模式在该领域有着广泛的应用,从模式求精到推荐再到决策。然而,现有的模式挖掘器在以下三个方面中至少有一个失败:将图形平面化为特征向量,从而丢失用于挖掘的宝贵信息,忽略模式知识,或者牺牲效率以换取表达能力。我们建议研究RDF数据集的可变模式语言的可伸缩性、表现力和覆盖率之间的更好权衡。这项研究将建立在旨在处理丰富模式(本体)的挖掘方法上,尽管输入数据略有不同且规模较小。因此,关键的挑战是扩大它们的范围和效率。为此,我们将研究如何根据一般数据挖掘问题对它们进行适当的重塑,以便能够应用最先进的数据结构、技术和结构结果。预期的应用是药物不良反应的分析(药物警戒),在重症监护中的决策,在基因组数据的系统发育分析中设计复杂的工作流程。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Valtchev, Petko其他文献
Bioinformatic Workflow Extraction from Scientific Texts based on Word Sense Disambiguation
- DOI:
10.1109/tcbb.2018.2847336 - 发表时间:
2018-11-01 - 期刊:
- 影响因子:4.5
- 作者:
Halioui, Ahmed;Valtchev, Petko;Diallo, Abdoulaye Banire - 通讯作者:
Diallo, Abdoulaye Banire
Valtchev, Petko的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Valtchev, Petko', 18)}}的其他基金
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
- 批准号:
249900-2013 - 财政年份:2017
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
- 批准号:
249900-2013 - 财政年份:2016
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
- 批准号:
249900-2013 - 财政年份:2015
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Pattern mining from linked data, methods, tools and applications
从关联数据、方法、工具和应用程序中进行模式挖掘
- 批准号:
249900-2013 - 财政年份:2013
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
- 批准号:
249900-2006 - 财政年份:2010
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
- 批准号:
249900-2006 - 财政年份:2009
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
- 批准号:
249900-2006 - 财政年份:2008
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
- 批准号:
249900-2006 - 财政年份:2007
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Lattice-based confrontation of ontologies
基于格的本体对抗
- 批准号:
249900-2006 - 财政年份:2006
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
A complete methology for manipulating large-size Galois lattices and derived structures
操纵大尺寸伽罗瓦格子和派生结构的完整方法
- 批准号:
249900-2002 - 财政年份:2005
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
基于Genome mining技术研究抑制表皮葡萄球菌生物膜形成的次级代谢产物
- 批准号:21242003
- 批准年份:2012
- 资助金额:10.0 万元
- 项目类别:专项基金项目
在我们的门前发掘化石——利用中国即将开展的巡天来研究银河系的演化
- 批准号:11043005
- 批准年份:2010
- 资助金额:10.0 万元
- 项目类别:专项基金项目
高维稀疏数据聚类研究
- 批准号:70771007
- 批准年份:2007
- 资助金额:16.0 万元
- 项目类别:面上项目
林火行为的动态模拟信息系统
- 批准号:30371171
- 批准年份:2003
- 资助金额:17.0 万元
- 项目类别:面上项目
相似海外基金
Viral Immunity and VAccination (VIVA) Human Immunology Project Consortium (HIPC)
病毒免疫和疫苗接种 (VIVA) 人类免疫学项目联盟 (HIPC)
- 批准号:
10435231 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
SCH: AI-Enhanced Multimodal Sensor-on-a-chip for Alzheimer's Disease Detection
SCH:用于阿尔茨海默病检测的人工智能增强型多模态芯片传感器
- 批准号:
10685378 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Knowledge Graph Mining for the Linked Open Data Cloud
链接开放数据云的知识图挖掘
- 批准号:
RGPIN-2017-04031 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
SCH: AI-Enhanced Multimodal Sensor-on-a-chip for Alzheimer's Disease Detection
SCH:用于阿尔茨海默病检测的人工智能增强型多模态芯片传感器
- 批准号:
10437992 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Viral Immunity and VAccination (VIVA) Human Immunology Project Consortium (HIPC)
病毒免疫和疫苗接种 (VIVA) 人类免疫学项目联盟 (HIPC)
- 批准号:
10595622 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
- 批准号:
10318416 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
- 批准号:
10668535 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Knowledge Graph Mining for the Linked Open Data Cloud
链接开放数据云的知识图挖掘
- 批准号:
RGPIN-2017-04031 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Translating Genetic Risk Factors to Therapies: From Big Data to Druggable Targets
将遗传风险因素转化为治疗方法:从大数据到可药物靶点
- 批准号:
10604891 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Roles of the X-linked Intellectual Disability gene ZDHHC9 in White Matter formation
X连锁智力障碍基因ZDHHC9在白质形成中的作用
- 批准号:
10354435 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:














{{item.name}}会员




