Numerical stability in data science
数据科学中的数值稳定性
基本信息
- 批准号:RGPIN-2022-04669
- 负责人:
- 金额:$ 2.99万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2022
- 资助国家:加拿大
- 起止时间:2022-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Data analyses are broadly impacted by numerical errors resulting from approximations used by all computers, which questions the accuracy, robustness, and reproducibility of derived predictions. The current solutions to address this issue mask the effects of numerical errors without addressing them or do not scale to the large software ecosystems used in data science. Thus, numerical instability is an important issue that threatens the trustworthiness of data science. The long-term goal of this research program is to support the numerical reliability of data science. In the coming years, it will aim at (1) quantifying the impact of numerical variability on a wide range of data science analyses, (2) enhancing the accuracy of data science predictions by leveraging numerical variability, and (3) accelerating data science through more efficient numerical representations. To achieve these objectives, I will rely on new software technologies developed in my research group to enable systematic numerical evaluations of large codebases and accurately pinpoint numerical issues. Moreover, I will develop novel frameworks to design data analyses mindful of numerical variability, resulting in increased robustness. Finally, I will take advantage of recent CPU hardware advances to substantially accelerate analyses where high numerical precision is not required. The impact of the proposed program stems from the development of high-risk ideas over a solid base of established technologies and preliminary data. The results of this research will broadly impact data science in academia and industry by improving the accuracy, robustness, precision, and efficiency of data-driven predictions. More specifically, data scientists will have novel ways to quantify the numerical reliability of their predictions, correct them accordingly, and substantially reduce their computational requirements. Furthermore, this program will be applied specifically to neurodata science and particularly to analyses involving Magnetic Resonance Imaging data of the brain. As a result, it will directly impact Canadian health by strengthening data-driven predictions related to various neurological disorders. This research program will train a diverse group of highly qualified personnel in data science, machine learning, numerical analysis, medical image analysis, software development, and high-performance computing, all skills in high demand in the academic and industrial job markets. Through a sustained involvement in open-science initiatives, it will maximize scientific impact while ensuring equity, diversity, and inclusion.
数据分析受到所有计算机所使用的近似值所产生的数值误差的广泛影响,这对导出的预测的准确性,鲁棒性和可重复性提出了质疑。目前解决这个问题的解决方案掩盖了数值错误的影响,而没有解决它们,或者不能扩展到数据科学中使用的大型软件生态系统。因此,数值不稳定性是威胁数据科学可信度的重要问题。该研究计划的长期目标是支持数据科学的数值可靠性。在未来几年,它将致力于(1)量化数值变异性对广泛的数据科学分析的影响,(2)通过利用数值变异性提高数据科学预测的准确性,以及(3)通过更有效的数值表示来加速数据科学。为了实现这些目标,我将依靠我的研究小组开发的新软件技术来实现对大型代码库的系统数值评估,并准确地确定数值问题。此外,我将开发新的框架来设计数据分析,注意数值变化,从而提高鲁棒性。最后,我将利用最新的CPU硬件进步来大大加速不需要高数值精度的分析。拟议计划的影响源于在现有技术和初步数据的坚实基础上开发高风险想法。这项研究的结果将通过提高数据驱动预测的准确性、鲁棒性、精度和效率,广泛影响学术界和工业界的数据科学。更具体地说,数据科学家将有新的方法来量化他们预测的数值可靠性,相应地纠正它们,并大大降低他们的计算要求。此外,该计划将专门应用于神经数据科学,特别是涉及大脑磁共振成像数据的分析。因此,它将通过加强与各种神经系统疾病相关的数据驱动预测,直接影响加拿大的健康。该研究计划将培养数据科学,机器学习,数值分析,医学图像分析,软件开发和高性能计算方面的高素质人才,这些技能在学术和工业就业市场上都有很高的需求。通过持续参与开放科学倡议,它将最大限度地提高科学影响力,同时确保公平,多样性和包容性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Glatard, Tristan其他文献
Modeling the Linux page cache for accurate simulation of data-intensive applications
对 Linux 页面缓存进行建模以准确模拟数据密集型应用程序
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Do, Hoang-Dung;Hayot-Sasson, Valerie;Ferreira da Silva, Rafael;Steele, Christopher;Casanova, Henri;Glatard, Tristan - 通讯作者:
Glatard, Tristan
A Virtual Imaging Platform for Multi-Modality Medical Image Simulation
- DOI:
10.1109/tmi.2012.2220154 - 发表时间:
2013-01-01 - 期刊:
- 影响因子:10.6
- 作者:
Glatard, Tristan;Lartizien, Carole;Friboulet, Denis - 通讯作者:
Friboulet, Denis
Data and Tools Integration in the Canadian Open Neuroscience Platform.
- DOI:
10.1038/s41597-023-01946-1 - 发表时间:
2023-04-06 - 期刊:
- 影响因子:9.8
- 作者:
Poline, Jean-Baptiste;Das, Samir;Glatard, Tristan;Madjar, Cecile;Dickie, Erin W. W.;Lecours, Xavier;Beaudry, Thomas;Beck, Natacha;Behan, Brendan;Brown, Shawn T. T.;Bujold, David;Beauvais, Michael;Caron, Bryan;Czech, Candice;Dharsee, Moyez;Dugre, Mathieu;Evans, Ken;Gee, Tom;Ippoliti, Giulia;Kiar, Gregory;Knoppers, Bartha Maria;Kuehn, Tristan;Le, Diana;Lo, Derek;Mazaheri, Mandana;MacFarlane, Dave;Muja, Naser;O'Brien, Emmet A. A.;O'Callaghan, Liam;Paiva, Santiago;Park, Patrick;Quesnel, Darcy;Rabelais, Henri;Rioux, Pierre;Legault, Melanie;Tremblay-Mercier, Jennifer;Rotenberg, David;Stone, Jessica;Strauss, Ted;Zaytseva, Ksenia;Zhou, Joey;Duchesne, Simon;Khan, Ali R. R.;Hill, Sean;Evans, Alan C. C. - 通讯作者:
Evans, Alan C. C.
A Service-Oriented Architecture enabling dynamic service grouping for optimizing distributed workflow execution
- DOI:
10.1016/j.future.2008.02.011 - 发表时间:
2008-07-01 - 期刊:
- 影响因子:7.5
- 作者:
Glatard, Tristan;Montagnat, Johan;Lingrand, Diane - 通讯作者:
Lingrand, Diane
Flexible and efficient workflow deployment of data-intensive applications on grids with MOTEUR
- DOI:
10.1177/1094342008096067 - 发表时间:
2008-08-01 - 期刊:
- 影响因子:3.1
- 作者:
Glatard, Tristan;Montagnat, Johan;Pennec, Xavier - 通讯作者:
Pennec, Xavier
Glatard, Tristan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Glatard, Tristan', 18)}}的其他基金
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
- 批准号:
CRC-2017-00325 - 财政年份:2022
- 资助金额:
$ 2.99万 - 项目类别:
Canada Research Chairs
Big Data Infrastructures For Neuroinformatics
神经信息学大数据基础设施
- 批准号:
CRC-2017-00325 - 财政年份:2021
- 资助金额:
$ 2.99万 - 项目类别:
Canada Research Chairs
Big Data platforms for science automation
用于科学自动化的大数据平台
- 批准号:
RGPIN-2017-06640 - 财政年份:2021
- 资助金额:
$ 2.99万 - 项目类别:
Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
- 批准号:
1000232010-2017 - 财政年份:2020
- 资助金额:
$ 2.99万 - 项目类别:
Canada Research Chairs
Big Data platforms for science automation
用于科学自动化的大数据平台
- 批准号:
RGPIN-2017-06640 - 财政年份:2020
- 资助金额:
$ 2.99万 - 项目类别:
Discovery Grants Program - Individual
Big Data platforms for science automation
用于科学自动化的大数据平台
- 批准号:
RGPIN-2017-06640 - 财政年份:2019
- 资助金额:
$ 2.99万 - 项目类别:
Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
- 批准号:
1000232010-2017 - 财政年份:2019
- 资助金额:
$ 2.99万 - 项目类别:
Canada Research Chairs
Artificial Intelligence for Truck Fleet Management**
卡车车队管理人工智能**
- 批准号:
533550-2018 - 财政年份:2018
- 资助金额:
$ 2.99万 - 项目类别:
Engage Grants Program
Big Data platforms for science automation
用于科学自动化的大数据平台
- 批准号:
RGPIN-2017-06640 - 财政年份:2018
- 资助金额:
$ 2.99万 - 项目类别:
Discovery Grants Program - Individual
Big Data Infrastructures for Neuroinformatics
神经信息学大数据基础设施
- 批准号:
1000232010-2017 - 财政年份:2018
- 资助金额:
$ 2.99万 - 项目类别:
Canada Research Chairs
相似国自然基金
铜募集微纳米网片上调LOX活性稳定胶原网络促进盆底修复的研究
- 批准号:82371638
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
随机激励下多稳态系统的临界过渡识别及Basin Stability分析
- 批准号:11872305
- 批准年份:2018
- 资助金额:65.0 万元
- 项目类别:面上项目
PPFS调节多倍体水稻花粉育性的功能研究
- 批准号:31140033
- 批准年份:2011
- 资助金额:10.0 万元
- 项目类别:专项基金项目
关于铁磁链方程组的解的部分正则性的研究
- 批准号:10926050
- 批准年份:2009
- 资助金额:3.0 万元
- 项目类别:数学天元基金项目
计算电磁学高稳定度辛算法研究
- 批准号:60931002
- 批准年份:2009
- 资助金额:200.0 万元
- 项目类别:重点项目
拉压应力状态下含充填断续节理岩体三维裂隙扩展及锚杆加固机理研究
- 批准号:40872203
- 批准年份:2008
- 资助金额:45.0 万元
- 项目类别:面上项目
铝合金中新型耐热合金相的应用基础研究
- 批准号:50801067
- 批准年份:2008
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于系统轨迹灵敏度的电力市场下最佳安全运行算法研究
- 批准号:50377028
- 批准年份:2003
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
Ionic Liquids of tenofovir prodrugs for improved oral bioavailability and antiviral efficacy
替诺福韦前药离子液体可提高口服生物利用度和抗病毒功效
- 批准号:
10699620 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
A novel peptide assay for hepcidin clinical monitoring
一种用于铁调素临床监测的新型肽测定方法
- 批准号:
10698746 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
Cancer-based discovery of novel mechanisms of chromatin control
基于癌症的染色质控制新机制的发现
- 批准号:
10660680 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
Sensory Phenotyping to Enhance Neuropathic Pain Drug Development
感觉表型增强神经病理性疼痛药物的开发
- 批准号:
10724809 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
Probing the role of somatic X-chromosome alterations in shaping cancer sex differences
探讨体细胞 X 染色体改变在塑造癌症性别差异中的作用
- 批准号:
10780163 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
Regulation of Intraocular Pressure via a Novel Adjustable Glaucoma Drainage Device
通过新型可调节青光眼引流装置调节眼压
- 批准号:
10735637 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
Chromatin State Alterations in Fanconi Anemia Hematologic Disease and Bone Marrow Failure
范可尼贫血血液疾病和骨髓衰竭中的染色质状态改变
- 批准号:
10735366 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别:
XVIR-110 an ultra-long-acting INSTI for HIV pre-exposure prophylaxis in IND-enabling studies
XVIR-110 是一种超长效 INSTI,用于 IND 支持研究中的 HIV 暴露前预防
- 批准号:
10764186 - 财政年份:2023
- 资助金额:
$ 2.99万 - 项目类别: