Big Data Curation

大数据策展

基本信息

  • 批准号:
    217606-2013
  • 负责人:
  • 金额:
    $ 3.21万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2017
  • 资助国家:
    加拿大
  • 起止时间:
    2017-01-01 至 2018-12-31
  • 项目状态:
    已结题

项目摘要

The wide-spread availability of vast amounts of structured data has made it possible to adopt algorithmic and statistical methods to solve data integration problems in new ways. A 2009 report indicated there were already over 100 million structured data tables on the Web. Efforts like Google's Fusion Tables make it easy to publish and share structured and semi-structured data. However, we are far from being able to automatically integrate and align this data so that we can easily use these rich data sources collectively in query answering, decision making, and prediction. Semantic integration at web-scale is a "grand challenge" problem. There is emerging evidence that some of the nuanced semantic differences that eluded enterprise-scale integration solutions, can now be discovered and resolved using knowledge from combinations of web data sources, some which have been curated by incentivized user communities who value the creation of reliable data. The deep heterogeneity and dynamic nature of this data demands new methods for not only alignment, but also for tracing the provenance of alignment decisions, and for maintaining and publishing consistent, properly aligned data. In this work, we will develop new methods for big data curation. Data curation involves the preparation of data for re-use or publishing, the proper modeling of context and semantics, and more generally the care of data to make it of maximal value to users. For big data, we must automate curation tasks to the extent possible and recognize the value of reusing data curated by user communities (such as open ontologies) to enhance and guide automation when publishing new data sources.
大量结构化数据的广泛可用性使得采用算法和统计方法以新的方式解决数据集成问题成为可能。2009年的一份报告指出,Web上已经有超过1亿个结构化数据表。谷歌的Fusion Tables使发布和共享结构化和半结构化数据变得更加容易。然而,我们还远远不能自动集成和对齐这些数据,以便我们可以在查询回答、决策制定和预测中轻松地使用这些丰富的数据源。网络规模的语义集成是一个“巨大的挑战”问题。越来越多的证据表明,企业规模集成解决方案无法解决的一些细微的语义差异,现在可以使用来自web数据源组合的知识来发现和解决,其中一些是由重视可靠数据创建的激励用户社区策划的。这种数据的深度异构性和动态性不仅需要新的方法来校准,还需要新的方法来跟踪校准决策的来源,以及维护和发布一致的、正确对齐的数据。在这项工作中,我们将开发大数据管理的新方法。数据管理包括为重用或发布数据做准备,对上下文和语义进行适当建模,以及更一般地对数据进行维护,使其对用户具有最大价值。对于大数据,我们必须尽可能地自动化管理任务,并认识到重用用户社区(如开放本体)管理的数据的价值,以增强和指导发布新数据源时的自动化。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Miller, Renée其他文献

Miller, Renée的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Miller, Renée', 18)}}的其他基金

Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2016
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    446340-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Big Data Curation
大数据策展
  • 批准号:
    446340-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    446340-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
NSERC/Business Intelligence Network
NSERC/商业智能网络
  • 批准号:
    350211-2007
  • 财政年份:
    2013
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Strategic Network Grants Program
NSERC/Business Intelligence Network
NSERC/商业智能网络
  • 批准号:
    350211-2007
  • 财政年份:
    2012
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Strategic Network Grants Program
Data integration and alignment
数据集成和对齐
  • 批准号:
    217606-2008
  • 财政年份:
    2012
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CSBR: Natural History: Big Data From Small Fossils: Curation and Digitization of Major Microvertebrate Paleontology Collections at The Florida Museum of Natural History
CSBR:自然历史:来自小化石的大数据:佛罗里达自然历史博物馆主要微脊椎动物古生物学收藏的管理和数字化
  • 批准号:
    1756306
  • 财政年份:
    2018
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Continuing Grant
Crowd-Assisted Deep Learning (CrADLe) Digital Curation to Translate Big Data into Precision Medicine
群体辅助深度学习 (CrADLe) 数字管理将大数据转化为精准医学
  • 批准号:
    10063300
  • 财政年份:
    2017
  • 资助金额:
    $ 3.21万
  • 项目类别:
Crowd-Assisted Deep Learning (CrADLe) Digital Curation to Translate Big Data into Precision Medicine
群体辅助深度学习 (CrADLe) 数字管理将大数据转化为精准医学
  • 批准号:
    9979659
  • 财政年份:
    2017
  • 资助金额:
    $ 3.21万
  • 项目类别:
Crowd-Assisted Deep Learning (CrADLe) Digital Curation to Translate Big Data into Precision Medicine
群体辅助深度学习 (CrADLe) 数字管理将大数据转化为精准医学
  • 批准号:
    9403171
  • 财政年份:
    2017
  • 资助金额:
    $ 3.21万
  • 项目类别:
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2016
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    446340-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Big Data Curation
大数据策展
  • 批准号:
    446340-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Curation
大数据策展
  • 批准号:
    217606-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 3.21万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了