SI2-SSI: Collaborative Research: Bringing End-to-End Provenance to Scientists

SI2-SSI:协作研究:为科学家提供端到端的来源

基本信息

  • 批准号:
    1450277
  • 负责人:
  • 金额:
    $ 142.27万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-06-01 至 2020-05-31
  • 项目状态:
    已结题

项目摘要

Reproducability is the cornerstone of scientific progress. Historically, scientists make their work reproducible by including a formulaic description of the experimental methodology used in an experiment. In an age of computational science, such descriptions no longer adequately describe scientific methodology. Instead, scientific reproducibility relies on a precise and actionable description of the data and programs used to conduct the research. Provenance is the name given to the description of how a digital artifact came to be in its present state. Provenance includes a precise specification of an experiment's input data and the programs or procedures applied to that data. Most computational platforms do not record such data provenance, making it difficult to ensure reproducability. This project addresses this problem through the development of tools that transparently and automatically capture data provenance as part of a scientist's normal computational workflow.An interdisciplinary team of computer scientists and ecologists have come together to develop tools to facilitate the capture, management, and query of data provenance -- the history of how a digital artifact came to be in its present state. Such data provenance improves the transparency, reliability, and reproducibility of scientific results. Most existing provenance systems require users to learn specialized tools and jargon and are unable to integrate provenance from different sources; these are serious obstacles to adoption by domain scientists. This project includes the design, development, deployment, and evaluation of an end-to-end system (eeProv) that encompasses the range of activity from original data analysis by domain scientists to management and analysis of the resulting provenance in a common framework with common tools. This project leverages and integrates development efforts on (1) an emerging system for generating provenance from a computing environment that scientists actually use (the R statistical language) with (2) an emerging system that utilizes a library of language and database adapters to store and manage provenance from virtually any source. Accomplishing the goals of this proposal requires fundamental research in resolving the semantic gap between provenance collected in different environments, capturing detailed provenance at the level of a programming language, defining precisely aspects of provenance required for different use cases, and making provenance accessible to scientists.
可复制性是科学进步的基石。从历史上看,科学家们通过对实验中使用的实验方法进行公式化描述来使他们的工作可重复。在计算科学的时代,这样的描述不再足以描述科学方法。相反,科学的可重复性依赖于对用于进行研究的数据和程序的精确且可操作的描述。出处是对数字人工制品如何处于其当前状态的描述的名称。来源包括实验输入数据的精确规格以及应用于该数据的程序或程序。大多数计算平台不记录这种数据来源,因此难以确保可复制性。该项目通过开发工具来解决这个问题,这些工具可以透明地自动捕获数据来源,作为科学家正常计算工作流程的一部分。一个由计算机科学家和生态学家组成的跨学科团队聚集在一起,开发工具来促进数据来源的捕获,管理和查询-数字人工制品如何成为目前状态的历史。 这样的数据出处提高了科学结果的透明度、可靠性和可重复性。大多数现有的出处系统需要用户学习专门的工具和行话,无法整合不同来源的出处,这些都是领域科学家采用的严重障碍。该项目包括端到端系统(eeProv)的设计、开发、部署和评估,该系统涵盖了从领域科学家的原始数据分析到使用通用工具在通用框架中管理和分析结果来源的活动范围。该项目利用并集成了以下开发工作:(1)一个新兴系统,用于从科学家实际使用的计算环境(R统计语言)生成出处;(2)一个新兴系统,利用语言库和数据库适配器来存储和管理几乎任何来源的出处。实现这一提议的目标需要进行基础研究,以解决在不同环境中收集的来源之间的语义差距,在编程语言层面捕获详细的来源,精确定义不同用例所需的来源方面,并使科学家可以访问来源。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Margo Seltzer其他文献

Exploring the Whole Rashomon Set of Sparse Decision Trees
探索整个罗生门稀疏决策树集
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rui Xin;Chudi Zhong;Zhi Chen;Takuya Takagi;Margo Seltzer;Cynthia Rudin
  • 通讯作者:
    Cynthia Rudin
NetShaper: A Differentially Private Network Side-Channel Mitigation System
NetShaper:差分专用网络侧通道缓解系统
  • DOI:
    10.48550/arxiv.2310.06293
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Amir Sabzi;Rut Vora;Swati Goswami;Margo Seltzer;Mathias L'ecuyer;Aastha Mehta
  • 通讯作者:
    Aastha Mehta
CHERI-picking: Leveraging capability hardware for prefetching
CHERI-picking:利用功能硬件进行预取
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shaurya Patel;Sidhartha Agrawal;Alexandra Fedorova;Margo Seltzer
  • 通讯作者:
    Margo Seltzer
Synthesizing Device Drivers with Ghost Writer
使用 Ghost Writer 合成设备驱动程序
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bingyao Wang;Sepehr Noorafshan;Reto Achermann;Margo Seltzer
  • 通讯作者:
    Margo Seltzer
Amazing Things Come From Having Many Good Models
令人惊奇的事情来自于拥有许多好的模型
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cynthia Rudin;Chudi Zhong;Lesia Semenova;Margo Seltzer;Ronald Parr;Jiachang Liu;Srikar Katta;Jon Donnelly;Harry Chen;Zachery Boner
  • 通讯作者:
    Zachery Boner

Margo Seltzer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Margo Seltzer', 18)}}的其他基金

EAGER: Citation++: Data Citation, Provenance, and Documentation
EAGER:引文:数据引文、出处和文档
  • 批准号:
    1448123
  • 财政年份:
    2015
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
XPS: FULL: CCA: Collaborative Research: Automatically Scalable Computation
XPS:完整:CCA:协作研究:自动可扩展计算
  • 批准号:
    1533737
  • 财政年份:
    2015
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
XPS: FULL: CCA: Collaborative Research: Automatically Scalable Computation
XPS:完整:CCA:协作研究:自动可扩展计算
  • 批准号:
    1438983
  • 财政年份:
    2014
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: Workload-Aware Storage Architectures for Optimal Performance and Energy Efficiency
CSR:中:协作研究:实现最佳性能和能源效率的工作负载感知存储架构
  • 批准号:
    1302334
  • 财政年份:
    2013
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
NSF: Request for Funding Student Participation in the File and Storage Technology (FAST) 2010
NSF:申请资助学生参与文件和存储技术 (FAST) 2010
  • 批准号:
    1023169
  • 财政年份:
    2010
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: Scalable Data Management Using Metadata and Provenance
协作研究:使用元数据和来源的可扩展数据管理
  • 批准号:
    0937914
  • 财政年份:
    2009
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Continuing Grant
SGER: PQL: A Path Query Language
SGER:PQL:路径查询语言
  • 批准号:
    0849392
  • 财政年份:
    2008
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
SENSORS: Hourglass: An Infrastructure for Sensor Network
传感器:沙漏:传感器网络基础设施
  • 批准号:
    0330244
  • 财政年份:
    2003
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
ANT: A Coherent Framework for Computer Science Education
ANT:计算机科学教育的连贯框架
  • 批准号:
    9950239
  • 财政年份:
    1999
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
CAREER: High Performance Storage Systems
职业:高性能存储系统
  • 批准号:
    9502156
  • 财政年份:
    1995
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Continuing Grant

相似国自然基金

考虑SSI效应的导管架式海洋平台抗震性能研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
考虑SSI的层间隔震高层建筑结构在三维地震下的响应研究
  • 批准号:
    52168072
  • 批准年份:
    2021
  • 资助金额:
    35 万元
  • 项目类别:
    地区科学基金项目
考虑SSI效应的大型储罐动力学特性及其隔板减晃研究
  • 批准号:
    51978336
  • 批准年份:
    2019
  • 资助金额:
    61.0 万元
  • 项目类别:
    面上项目
考虑SSI效应的摇摆墙-框架结构抗震机理及性能评估方法研究
  • 批准号:
    51978524
  • 批准年份:
    2019
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
考虑能量需求和SSI效应的RC梁式桥基于性能的抗震设计方法
  • 批准号:
    50908014
  • 批准年份:
    2009
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: SI2-SSI: Expanding Volunteer Computing
合作研究:SI2-SSI:扩展志愿者计算
  • 批准号:
    2039142
  • 财政年份:
    2020
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
SI2-SSI: Collaborative Research: Einstein Toolkit Community Integration and Data Exploration
SI2-SSI:协作研究:Einstein Toolkit 社区集成和数据探索
  • 批准号:
    2114580
  • 财政年份:
    2020
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Continuing Grant
Collaborative Research: SI2-SSI: Expanding Volunteer Computing
合作研究:SI2-SSI:扩展志愿者计算
  • 批准号:
    2001752
  • 财政年份:
    2019
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Expanding Volunteer Computing
合作研究:SI2-SSI:扩展志愿者计算
  • 批准号:
    1664022
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Cyberinfrastructure for Advancing Hydrologic Knowledge through Collaborative Integration of Data Science, Modeling and Analysis
合作研究:SI2-SSI:通过数据科学、建模和分析的协作集成推进水文知识的网络基础设施
  • 批准号:
    1664061
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
SI2-SSI: Collaborative Research: Scalable Infrastructure for Enabling Multiscale and Multiphysics Applications in Fluid Dynamics, Solid Mechanics, and Fluid-Structure Interaction
SI2-SSI:协作研究:可扩展基础设施,支持流体动力学、固体力学和流固耦合中的多尺度和多物理场应用
  • 批准号:
    1836797
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Open Source Support for Massively Parallel, Generic Finite Element Methods
合作研究:SI2-SSI:对大规模并行、通用有限元方法的开源支持
  • 批准号:
    1741870
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Modules for Experiments in Stellar Astrophysics
合作研究:SI2-SSI:恒星天体物理实验模块
  • 批准号:
    1663684
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Inquiry-Focused Volumetric Data Analysis Across Scientific Domains: Sustaining and Expanding the yt Community
合作研究:SI2-SSI:跨科学领域以调查为中心的体积数据分析:维持和扩展 yt 社区
  • 批准号:
    1663893
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Cyberinfrastructure for Advancing Hydrologic Knowledge through Collaborative Integration of Data Science, Modeling and Analysis
合作研究:SI2-SSI:通过数据科学、建模和分析的协作集成推进水文知识的网络基础设施
  • 批准号:
    1664018
  • 财政年份:
    2017
  • 资助金额:
    $ 142.27万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了