A Training Module for Reproducible Data Science Research

可重复数据科学研究的培训模块

基本信息

  • 批准号:
    10199242
  • 负责人:
  • 金额:
    $ 9.42万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-06-01 至 2024-05-31
  • 项目状态:
    已结题

项目摘要

Abstract Scientific progress depends on the ability of scientists to communicate the details of their investigations, allowing others to learn new techniques and procedures and to critically review the process leading to any significant findings. However, this foundational aspect of the scientific process faces significant challenges. Rapid advances in computing technology have led to high-throughput data collection coupled with the application of complex statistical algorithms for data analysis. As a result, it has become nearly impossible to describe the scientific process precisely using traditional methods of communication. Compounding the problem of communicating data analytic complexity is the inability of traditional educational programs to keep up with technological and methodological changes. The shortage of data analytic skills and the corresponding lack of transparency regarding the scientific process is at the very core of the reproducibility and replication crisis in science today. In order to address the problem of scientific irreproducibility, training is needed in the fundamental aspects of good data analysis and reproducible research. Such training needs to go beyond traditional approaches which focus on developing a toolbox of statistical methods. While knowledge of tools and their properties is necessary for good data analysis, it is far from sufficient. Additional knowledge is required to combine those tools to produce a sound data analysis in a transparent manner. Furthermore, we must go beyond traditional methods of classroom learning in order to reach the entire scientific workforce. We will build training modules for improving data science research by leveraging recent work done by members of the Johns Hopkins Data Science Lab. We will focus on two primary tracks: (1) strategies for reproducible data science, which include the higher-level principles for designing good data analyses, recognizing poor data analysis, and providing a proper critique of a data analysis; and (2) technologies and workflows, which cover the software tools for doing data analysis in a reproducible, distributable, and reusable manner. The materials developed in this project will supplement traditional training programs in biomedical data science fields and will be made entirely open source for others to use and adapt.
摘要 科学进步取决于科学家交流其研究成果细节的能力 调查,允许其他人学习新的技术和程序并进行批判性审查 导致任何重大发现的过程。然而,这一基础方面 科学进程面临重大挑战。计算技术的快速发展导致了 将高通量数据收集与复杂统计的应用相结合 用于数据分析的算法。因此,几乎不可能描述 科学过程中精确使用传统的沟通方式。使之复杂化 沟通数据分析的复杂性问题是传统教育的无能为力 计划,以跟上技术和方法的变化。数据的短缺 关于科学过程的分析技能和相应的缺乏透明度的问题在 当今科学的可再生性和复制危机的核心。为了解决 科学上的不可再生性问题,需要在善的基本方面进行培训 数据分析和可重复研究。这样的培训需要超越传统的 侧重于开发统计方法工具箱的方法。虽然知道 工具及其属性是良好的数据分析所必需的,但这远远不够。其他内容 要将这些工具结合在一起,以透明的方式生成可靠的数据分析,需要知识 举止。此外,我们必须超越传统的课堂学习方法,以便 接触到整个科学工作者。我们将构建培训模块,以提高数据科学水平 通过利用约翰霍普金斯数据科学实验室成员最近所做的工作进行研究。 我们将重点关注两个主要方面:(1)可复制数据科学的战略,包括 设计好的数据分析、识别差的数据分析的更高级别的原则,以及 对数据分析提供适当的批评;以及(2)技术和工作流程,包括 以可重复、可分发和可重复使用的方式进行数据分析的软件工具。 在这个项目中开发的材料将补充 生物医学数据科学领域,并将完全开源,供其他人使用和 适应。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ROGER PENG其他文献

ROGER PENG的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ROGER PENG', 18)}}的其他基金

NIH R25 - A Training Module for Reproducible Data Science Research
NIH R25 - 可重复数据科学研究的培训模块
  • 批准号:
    10807490
  • 财政年份:
    2021
  • 资助金额:
    $ 9.42万
  • 项目类别:
A Training Module for Reproducible Data Science Research
可重复数据科学研究的培训模块
  • 批准号:
    10409825
  • 财政年份:
    2021
  • 资助金额:
    $ 9.42万
  • 项目类别:
NIH R25 - A Training Module for Reproducible Data Science Research
NIH R25 - 可重复数据科学研究的培训模块
  • 批准号:
    10663171
  • 财政年份:
    2021
  • 资助金额:
    $ 9.42万
  • 项目类别:
Extreme Heat and Human Health: Characterizing Vulnerability in a Changing Climate
极端高温与人类健康:描述气候变化中的脆弱性
  • 批准号:
    8308530
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Statistical Methods for Complex Enivronmental Health Data
复杂环境健康数据的统计方法
  • 批准号:
    8402810
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Statistical Methods for Complex Enivronmental Health Data
复杂环境健康数据的统计方法
  • 批准号:
    8231319
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Extreme Heat and Human Health: Characterizing Vulnerability in a Changing Climate
极端高温与人类健康:描述气候变化中的脆弱性
  • 批准号:
    8148057
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Statistical Methods for Complex Enivronmental Health Data
复杂环境健康数据的统计方法
  • 批准号:
    8600272
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Statistical Methods for Complex Enivronmental Health Data
复杂环境健康数据的统计方法
  • 批准号:
    8019720
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:
Statistical Methods for Complex Enivronmental Health Data
复杂环境健康数据的统计方法
  • 批准号:
    8795714
  • 财政年份:
    2011
  • 资助金额:
    $ 9.42万
  • 项目类别:

相似国自然基金

层出镰刀菌氮代谢调控因子AreA 介导伏马菌素 FB1 生物合成的作用机理
  • 批准号:
    2021JJ40433
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
寄主诱导梢腐病菌AreA和CYP51基因沉默增强甘蔗抗病性机制解析
  • 批准号:
    32001603
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
AREA国际经济模型的移植.改进和应用
  • 批准号:
    18870435
  • 批准年份:
    1988
  • 资助金额:
    2.0 万元
  • 项目类别:
    面上项目

相似海外基金

Application of Practice-Oriented Area Studies to Solve Rural Issues: A Case Study on the Spread of Organic Agriculture in Bhutan
应用以实践为导向的区域研究解决农村问题:以不丹有机农业推广为例
  • 批准号:
    21J15671
  • 财政年份:
    2021
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
An Empirical Study on the Reorganization Process of Local Educational Governance: A Case Study of Ena Area
地方教育治理重组过程的实证研究——以惠那地区为例
  • 批准号:
    20K22259
  • 财政年份:
    2020
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Rethinking of Cultural Traditions in the East China Sea Area: A Comparative Case Study on Woman-centered Communal Rituals in Border Areas among Japan, South Korea and China
东海地区文化传统的反思:中日韩边境地区以妇女为中心的公共仪式比较案例研究
  • 批准号:
    20K12369
  • 财政年份:
    2020
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Strategies of Traditional Craft Industries for vitalizing the local economy: A Case Study of Tourism Town Development in a Porcelain Production Area
传统工艺产业振兴地方经济的策略——以陶瓷产区旅游小镇发展为例
  • 批准号:
    19K12553
  • 财政年份:
    2019
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Stability and Sustainability of the Arab Monarchies: A Comprehensive Case Study on Hashemite Kingdom of Jordan and Its Surrounding Area
阿拉伯君主制的稳定性和可持续性:约旦哈希姆王国及其周边地区的综合案例研究
  • 批准号:
    17K02058
  • 财政年份:
    2017
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Bottomization of Indigenous People in Urban area: The case study of work and life of Sama bajau in Manila
城市地区原住民的底层化:马尼拉萨玛巴瑶人工作和生活的案例研究
  • 批准号:
    16K17253
  • 财政年份:
    2016
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Rehabilitation of saltmarsh fish and invertebrate assemblages by construction of a large-scale creek: a case study for archetypal landscape restoration in the coastal area of Tokyo Bay
通过建造大型小溪来恢复盐沼鱼类和无脊椎动物群落:东京湾沿海地区典型景观恢复的案例研究
  • 批准号:
    16K07821
  • 财政年份:
    2016
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A case study of change from Kofun prriod to Asuka period in Ikaruga area
斑鸠地区古坟时期到飞鸟时代变迁的事例
  • 批准号:
    26370907
  • 财政年份:
    2014
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Right-Wing Extremism and Gender: Political Socialisation and Processes of Radicalisation in Rural Area. A Case Study.
右翼极端主义和性别:农村地区的政治社会化和激进化进程。
  • 批准号:
    260066309
  • 财政年份:
    2014
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Research Grants
A Practical Study through Reconstruction Community Development Planning After the GREAT EAST JAPAN EARTHQUAKE by the Citizen Initiative -A case study on the Yuriage area in Natori City-
公民倡议的东日本大地震后重建社区发展规划的实践研究 -以名取市 Yuriage 地区为例 -
  • 批准号:
    25630254
  • 财政年份:
    2013
  • 资助金额:
    $ 9.42万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了