Big Data platforms for science automation

用于科学自动化的大数据平台

基本信息

  • 批准号:
    RGPIN-2017-06640
  • 负责人:
  • 金额:
    $ 1.46万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2020
  • 资助国家:
    加拿大
  • 起止时间:
    2020-01-01 至 2021-12-31
  • 项目状态:
    已结题

项目摘要

The objective of my research program is to automate Big Data analyses from data processing to knowledge publication. In the next years, I will focus on the following three objectives of this immense challenge. (1) Interoperability among Big Data platforms: Big Data platforms used in science currently operate in silos, which hinders open science, reduces the overall quality of platforms by limiting competition, and creates technological dependence on particular software projects. I will design the building blocks of a decentralized network connecting platforms so that data, processing pipelines and analyses can be uniformly found, accessed and reused in various platforms. (2) Reproducibility of Big Data analyses over time and space: science is going through a severe reproducibility crisis, which, if not properly addressed, will prevent various disciplines from leveraging the tremendous wealth of data that is acquired: Big Data has to be converted into trusted knowledge. I will develop methods to identify, quantify and correct reproducibility issues, focusing on the challenges that originate in the computing infrastructure. (3) Performance optimization of Big Data computations: while they have been transformational for industry, Big Data technologies remain underused in science, due to the lack of appropriate benchmarks and performance optimization studies. I will design and create an optimized, easy-to-use Big Data processing environment for large scientific datasets. These three objectives echo the notorious V's of Big Data: interoperability addresses data Variety, reproducibility targets Veracity, and performance provides Velocity and manages data Volume. Overall, this program will speed up and improve the quality of knowledge production. It will foster cyberinfrastructure automation, by allowing scientific objects to seamlessly move across platforms, by ensuring the consistency of results computed in different platforms and by accelerating Big Data analyses. While potential applications of this research span the whole spectrum of scientific disciplines engaged in data science, I will focus on neuroinformatics, exploiting my long-standing top-level collaborations in this field and leveraging the tremendous experience acquired with the development and operation of the VIP and CBRAIN platforms. Technology transfer to the Canadian industry is also expected, in the IT (Big Data and cloud) and pharmaceutical sectors.
我的研究计划的目标是从数据处理到知识发布的大数据分析自动化。在今后几年里,我将重点关注这一巨大挑战的以下三个目标。(1)大数据平台之间的互操作性:科学中使用的大数据平台目前在孤岛中运行,这阻碍了开放科学,通过限制竞争降低了平台的整体质量,并造成了对特定软件项目的技术依赖。我将设计一个连接平台的分散网络的构建模块,以便数据,处理管道和分析可以在各种平台中统一查找,访问和重用。(2)大数据分析在时间和空间上的可复制性:科学正在经历一场严重的可复制性危机,如果不妥善解决,将阻止各种学科利用所获得的巨大数据财富:大数据必须转换为可信的知识。我将开发方法来识别,量化和纠正可重复性问题,重点是计算基础设施中产生的挑战。(3)大数据计算的性能优化:虽然大数据技术对行业具有变革性意义,但由于缺乏适当的基准和性能优化研究,大数据技术在科学领域仍然没有得到充分利用。我将为大型科学数据集设计和创建一个优化的,易于使用的大数据处理环境。这三个目标呼应了大数据臭名昭著的V:互操作性解决了数据的多样性,可再现性目标是准确性,性能提供了速度并管理数据量。 总的来说,该计划将加快和提高知识生产的质量。它将促进网络基础设施自动化,允许科学对象在平台间无缝移动,确保不同平台计算结果的一致性,并加速大数据分析。虽然这项研究的潜在应用涵盖了数据科学领域的所有科学学科,但我将专注于神经信息学,利用我在该领域的长期顶级合作,并利用VIP和CBRAIN平台的开发和运营所获得的丰富经验。预计还将向加拿大IT(大数据和云)和制药行业进行技术转让。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Glatard, Tristan其他文献

Modeling the Linux page cache for accurate simulation of data-intensive applications
对 Linux 页面缓存进行建模以准确模拟数据密集型应用程序
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Do, Hoang-Dung;Hayot-Sasson, Valerie;Ferreira da Silva, Rafael;Steele, Christopher;Casanova, Henri;Glatard, Tristan
  • 通讯作者:
    Glatard, Tristan
A Virtual Imaging Platform for Multi-Modality Medical Image Simulation
  • DOI:
    10.1109/tmi.2012.2220154
  • 发表时间:
    2013-01-01
  • 期刊:
  • 影响因子:
    10.6
  • 作者:
    Glatard, Tristan;Lartizien, Carole;Friboulet, Denis
  • 通讯作者:
    Friboulet, Denis
Data and Tools Integration in the Canadian Open Neuroscience Platform.
  • DOI:
    10.1038/s41597-023-01946-1
  • 发表时间:
    2023-04-06
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Poline, Jean-Baptiste;Das, Samir;Glatard, Tristan;Madjar, Cecile;Dickie, Erin W. W.;Lecours, Xavier;Beaudry, Thomas;Beck, Natacha;Behan, Brendan;Brown, Shawn T. T.;Bujold, David;Beauvais, Michael;Caron, Bryan;Czech, Candice;Dharsee, Moyez;Dugre, Mathieu;Evans, Ken;Gee, Tom;Ippoliti, Giulia;Kiar, Gregory;Knoppers, Bartha Maria;Kuehn, Tristan;Le, Diana;Lo, Derek;Mazaheri, Mandana;MacFarlane, Dave;Muja, Naser;O'Brien, Emmet A. A.;O'Callaghan, Liam;Paiva, Santiago;Park, Patrick;Quesnel, Darcy;Rabelais, Henri;Rioux, Pierre;Legault, Melanie;Tremblay-Mercier, Jennifer;Rotenberg, David;Stone, Jessica;Strauss, Ted;Zaytseva, Ksenia;Zhou, Joey;Duchesne, Simon;Khan, Ali R. R.;Hill, Sean;Evans, Alan C. C.
  • 通讯作者:
    Evans, Alan C. C.
A Service-Oriented Architecture enabling dynamic service grouping for optimizing distributed workflow execution
Flexible and efficient workflow deployment of data-intensive applications on grids with MOTEUR

Glatard, Tristan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Glatard, Tristan', 18)}}的其他基金

Numerical stability in data science
数据科学中的数值稳定性
  • 批准号:
    RGPIN-2022-04669
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
  • 批准号:
    CRC-2017-00325
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Canada Research Chairs
Big Data Infrastructures For Neuroinformatics
神经信息学大数据基础设施
  • 批准号:
    CRC-2017-00325
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Canada Research Chairs
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
  • 批准号:
    1000232010-2017
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Canada Research Chairs
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2019
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
  • 批准号:
    1000232010-2017
  • 财政年份:
    2019
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Canada Research Chairs
Artificial Intelligence for Truck Fleet Management**
卡车车队管理人工智能**
  • 批准号:
    533550-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Engage Grants Program
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2018
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
  • 批准号:
    1000232010-2017
  • 财政年份:
    2018
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Canada Research Chairs

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Change and Stability of Canada's Forested and Aquatic Landscapes: Big-data Remote Sensing on Multiple Platforms
加拿大森林和水生景观的变化与稳定:多平台大数据遥感
  • 批准号:
    RGPIN-2021-03253
  • 财政年份:
    2022
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Ontology Based Data Access on Big Data Platforms
大数据平台上基于本体的数据访问
  • 批准号:
    531861-2018
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Collaborative Research and Development Grants
Change and Stability of Canada's Forested and Aquatic Landscapes: Big-data Remote Sensing on Multiple Platforms
加拿大森林和水生景观的变化与稳定:多平台大数据遥感
  • 批准号:
    RGPIN-2021-03253
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2021
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Ontology Based Data Access on Big Data Platforms
大数据平台上基于本体的数据访问
  • 批准号:
    531861-2018
  • 财政年份:
    2020
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Collaborative Research and Development Grants
Ontology Based Data Access on Big Data Platforms
大数据平台上基于本体的数据访问
  • 批准号:
    531861-2018
  • 财政年份:
    2019
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Collaborative Research and Development Grants
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2019
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2018
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Big Data platforms for science automation
用于科学自动化的大数据平台
  • 批准号:
    RGPIN-2017-06640
  • 财政年份:
    2017
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Discovery Grants Program - Individual
Fast Algorithms for Solving Big Data PDE Parameter Estimation Problems on Cloud Computing Platforms
云计算平台上解决大数据偏微分方程参数估计问题的快速算法
  • 批准号:
    1522599
  • 财政年份:
    2015
  • 资助金额:
    $ 1.46万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了