EAGER: SciDatBench: Principles and Prototypes of Science Data Benchmarks

EAGER:SciDatBench:科学数据基准的原理和原型

基本信息

  • 批准号:
    2204115
  • 负责人:
  • 金额:
    $ 29.69万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-01-01 至 2023-10-31
  • 项目状态:
    已结题

项目摘要

Analysis of large scientific data sets requires new research in both the data analysis methods and the information technology hardware and software to use in the analysis. This project is investigating and prototyping a new set of science data benchmarks, dubbed SciDatBench. It establishes a new collection of important and representative big scientific datasets together with typical software implementations of the machine learning algorithms that are needed for best practice analysis. The SciDatBench collection is accompanied by documentation allowing it to be used in the training of researchers in the rapidly evolving Big Data analysis techniques. The project has a potential to impact a broad range of scientific disciplines including eventually material sciences, environmental sciences, life sciences including epidemiology, fusion, particle physics, astronomy, earthquake, and earth sciences, with more than one representative problem from each of these domains.SciDatBench generates particular instances of big data analysis benchmarks and establishes a sustainable process for maintaining and enhancing them. This collection includes both standalone examples and end-to-end examples needing multiple components that are seen in the analysis of many science experiments. SciDatBench is affiliated as an approved Science Data working group with the very successful MLPerf activity with 80 organizational members looking at Industry machine learning benchmarks. The state-of-the-art examples in SciDatBench are contributing to progress in scientific discovery that advances the national health, prosperity, and welfare, as stated by NSF's mission. The project is proactively involving under-represented communities in its activities. SciDatBench supports comparative studies and identifies requirements for future cyberinfrastructure to support scientific data analysis.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
对大型科学数据集的分析需要在数据分析方法以及在分析中使用的信息技术硬件和软件方面进行新的研究。该项目正在调查一套新的科学数据基准,并将其制作成原型,该基准被称为本科学数据基准。它建立了一个新的重要和有代表性的大科学数据集,以及最佳实践分析所需的机器学习算法的典型软件实现。本报告所附文件可用于对研究人员进行快速发展的大数据分析技术的培训。该项目有可能影响广泛的科学学科,最终包括材料科学、环境科学、生命科学(包括流行病学、核聚变、粒子物理、天文学、地震和地球科学),每个领域都有不止一个具有代表性的问题。本网站生成大数据分析基准的特定实例,并建立维护和增强这些基准的可持续过程。此集合既包括独立的示例,也包括需要多个组件的端到端示例,这些示例在许多科学实验的分析中都可以看到。本网站是一个经批准的科学数据工作组,拥有非常成功的MLPerf活动,有80名组织成员关注行业机器学习基准。正如NSF的使命所表明的那样,本科学数据中心的最新实例正在为促进国家健康、繁荣和福利的科学发现方面的进步做出贡献。该项目正在积极地让代表性不足的社区参与其活动。本奖项支持比较研究,并确定对未来网络基础设施的要求,以支持科学数据分析。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Opportunities for enhancing MLCommons efforts while leveraging insights from educational MLCommons earthquake benchmarks efforts
加强 MLCommons 工作的机会,同时利用教育 MLCommons 地震基准工作的见解
  • DOI:
    10.3389/fhpcp.2023.1233877
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    von Laszewski, Gregor;Fleischer, J. P.;Knuuti, Robert;Fox, Geoffrey C.;Kolessar, Jake;Butler, Thomas S.;Fox, Judy
  • 通讯作者:
    Fox, Judy
MLPerf™ HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems
MLPerf™ HPC:HPC 系统上科学机器学习的整体基准套件
Templated Hybrid Reusable Computational Analytics Workflow Management with Cloudmesh, Applied to the Deep Learning MLCommons Cloudmask Application
使用 Cloudmesh 进行模板化混合可重用计算分析工作流程管理,应用于深度学习 MLCommons Cloudmask 应用程序
  • DOI:
    10.1109/e-science58273.2023.10254942
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    von Laszewski, Gregor;Fleischer, J.P.;Fox, Geoffrey C.;Papay, Juri;Jackson, Sam;Thiyagalingam, Jeyan
  • 通讯作者:
    Thiyagalingam, Jeyan
Does the Catalog of California Earthquakes, with Aftershocks Included, Contain Information about Future Large Earthquakes?
包括余震在内的加州地震目录是否包含未来大地震的信息?
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    John B. Rundle;Andrea Donnellan;Geoffrey Fox;Lisa Grant Ludwig;James P Crutchfield
  • 通讯作者:
    James P Crutchfield
Scientific machine learning benchmarks
  • DOI:
    10.1038/s42254-022-00441-7
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    38.5
  • 作者:
    J. Thiyagalingam;M. Shankar;Geoffrey Fox;Tony (Anthony) John Grenville Hey
  • 通讯作者:
    J. Thiyagalingam;M. Shankar;Geoffrey Fox;Tony (Anthony) John Grenville Hey
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Geoffrey Fox其他文献

QuakeSim: Integrated modeling and analysis of geologic and remotely sensed data
QuakeSim:地质和遥感数据的集成建模和分析
  • DOI:
    10.1109/aero.2012.6187219
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Donnellan;Jay Parker;R. Granat;E. D. Jong;Shigeru Suzuki;M. Pierce;Geoffrey Fox;John Rundle;Dennis McLeod;R. Al;L. G. Ludwig
  • 通讯作者:
    L. G. Ludwig
Gateways to Discovery: Cyberinfrastructure for the Long Tail of Science
发现之门:科学长尾的网络基础设施
  • DOI:
    10.1145/2616498.2616540
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    R. Moore;C. Baru;Diane A. Baxter;Geoffrey Fox;A. Majumdar;P. Papadopoulos;W. Pfeiffer;R. Sinkovits;Shawn M. Strande;M. Tatineni;R. Wagner;Nancy Wilkins;M. Norman
  • 通讯作者:
    M. Norman
Complete exchange on the CM-5 and Touchstone Delta
  • DOI:
    10.1007/bf01901612
  • 发表时间:
    1995-12-01
  • 期刊:
  • 影响因子:
    2.700
  • 作者:
    Rajeev Thakur;Ravi Ponnusamy;Alok Choudhary;Geoffrey Fox
  • 通讯作者:
    Geoffrey Fox
Advances in big data programming, system software and HPC convergence
  • DOI:
    10.1007/s11227-018-2706-x
  • 发表时间:
    2019-02-26
  • 期刊:
  • 影响因子:
    2.700
  • 作者:
    Ching-Hsien Hsu;Geoffrey Fox;Geyong Min;Sugam Sharma
  • 通讯作者:
    Sugam Sharma
Design patterns for scientific applications in DryadLINQ CTP
DryadLINQ CTP 中科学应用的设计模式
  • DOI:
    10.1145/2087522.2087533
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hui Li;Yang Ruan;Yuduo Zhou;J. Qiu;Geoffrey Fox
  • 通讯作者:
    Geoffrey Fox

Geoffrey Fox的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Geoffrey Fox', 18)}}的其他基金

Conference: 2023 NSF CyberTraining Principal Investigator (PI) Meeting
会议:2023 年 NSF 网络培训首席研究员 (PI) 会议
  • 批准号:
    2333991
  • 财政年份:
    2023
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Smart Surrogates for High Performance Scientific Simulations
合作研究:OAC Core:高性能科学模拟的智能替代品
  • 批准号:
    2212550
  • 财政年份:
    2022
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
CyberTraining: CIC: CyberTraining for Students and Technologies from Generation Z
网络培训:CIC:针对 Z 世代学生和技术的网络培训
  • 批准号:
    2200409
  • 财政年份:
    2021
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
Collaborative Research: Framework: Software: CINES: A Scalable Cyberinfrastructure for Sustained Innovation in Network Engineering and Science
合作研究:框架:软件:CINES:用于网络工程和科学持续创新的可扩展网络基础设施
  • 批准号:
    2210266
  • 财政年份:
    2021
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
EAGER: SciDatBench: Principles and Prototypes of Science Data Benchmarks
EAGER:SciDatBench:科学数据基准的原理和原型
  • 批准号:
    2038007
  • 财政年份:
    2020
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
CyberTraining: CIC: CyberTraining for Students and Technologies from Generation Z
网络培训:CIC:针对 Z 世代学生和技术的网络培训
  • 批准号:
    1829704
  • 财政年份:
    2018
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
Collaborative Research: Framework: Software: CINES: A Scalable Cyberinfrastructure for Sustained Innovation in Network Engineering and Science
合作研究:框架:软件:CINES:用于网络工程和科学持续创新的可扩展网络基础设施
  • 批准号:
    1835631
  • 财政年份:
    2018
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
Collaborative Research: Streaming and Steering Applications: Requirements and Infrastructure (October 1-3, 2015)
合作研究:流媒体和转向应用:要求和基础设施(2015 年 10 月 1-3 日)
  • 批准号:
    1549544
  • 财政年份:
    2015
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
International Summer School on Data Science for Scattering Reactions
散射反应数据科学国际暑期学校
  • 批准号:
    1513524
  • 财政年份:
    2015
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
Collaborative Research: The Power of Many: Scalable Compute and Data-Intensive Science on Blue Waters
协作研究:多人的力量:蓝水域的可扩展计算和数据密集型科学
  • 批准号:
    1515779
  • 财政年份:
    2015
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant

相似海外基金

EAGER: SciDatBench: Principles and Prototypes of Science Data Benchmarks
EAGER:SciDatBench:科学数据基准的原理和原型
  • 批准号:
    2038007
  • 财政年份:
    2020
  • 资助金额:
    $ 29.69万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了