POSE: Phase II: Expanding the data.table ecosystem for efficient big data manipulation in R

POSE:第二阶段:扩展 data.table 生态系统以在 R 中进行高效的大数据操作

基本信息

  • 批准号:
    2303612
  • 负责人:
  • 金额:
    $ 73.19万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-15 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

Professor Toby Hocking from Northern Arizona University is supported by an award from the Pathways to Enable Open-Source Ecosystems (POSE) program in the Directorate for Technology, Innovation and Partnerships (TIP). More data is being systematically gathered and recorded than at any previous time in human history, and efficient software packages are required to store and analyze these data using limited computational resources. A leading, state-of-the-art example is data.table, which is free/open-source software for in-memory data manipulation/analysis, implemented as an R package with C code that is highly efficient in terms of both computation time and memory usage. Although data.table has a substantial number of users (including thousands of other R packages which import functionality from data.table), the growth of data.table is limited by (1) its flat/informal leadership structure with only one author at the top who can approve new code contributions, (2) lack of documentation/translations and community standards for promoting diversity/inclusion, and (3) lack of infrastructure for systematic software testing. This project will expand the open-source ecosystem of users, contributors, and developers of data.table, by addressing these issues. In particular, this project will create (1) a written governance document with a new hierarchical leadership structure, (2) new documentation materials for onboarding new users/contributors, including translations and community standards to encourage diversity/inclusion, and (3) new testing software and infrastructure. Furthermore, the project includes plans to systematically evaluate the broader impacts of this effort on the data.table ecosystem by measuring changes to important metrics (number of unique contributors, diversity of contributors, number of dependent packages, etc). The result of this project will be a self-sustaining open-source ecosystem for data.table, which will allow it to grow into a more powerful data analysis tool that will be used by more people, and more diverse people, in the future.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
来自北方亚利桑那大学的Toby Hocking教授获得了技术、创新和伙伴关系理事会(TIP)开源生态系统(POSE)项目的支持。系统地收集和记录的数据比人类历史上任何时候都多,需要高效的软件包来使用有限的计算资源存储和分析这些数据。一个领先的、最先进的例子是data.table,它是一种用于内存中数据操作/分析的免费/开源软件,作为带有C代码的R包实现,在计算时间和内存使用方面都非常高效。虽然data.table有大量的用户(包括数千个从data.table导入功能的其他R包),data.table的增长受到以下限制:(1)其扁平/非正式的领导结构,只有一位作者可以批准新的代码贡献,(2)缺乏文档/翻译和促进多样性/包容性的社区标准,缺乏系统的软件测试基础设施。该项目将通过解决这些问题来扩展data.table的用户,贡献者和开发人员的开源生态系统。特别是,该项目将创建(1)具有新的分层领导结构的书面治理文档,(2)用于新用户/贡献者的新文档材料,包括翻译和社区标准,以鼓励多样性/包容性,以及(3)新的测试软件和基础设施。此外,该项目还计划通过衡量重要指标(独立贡献者的数量、贡献者的多样性、依赖包的数量等)的变化,系统地评估这项工作对data.table生态系统的更广泛影响。该项目的成果将是一个可自我维持的开源生态系统data.table,这将使其成长为一个更强大的数据分析工具,将来将被更多的人和更多样化的人使用。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Toby Hocking其他文献

Toby Hocking的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark Supercooled Phase Transition
  • 批准号:
    24ZR1429700
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ATLAS实验探测器Phase 2升级
  • 批准号:
    11961141014
  • 批准年份:
    2019
  • 资助金额:
    3350 万元
  • 项目类别:
    国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
  • 批准号:
    41802035
  • 批准年份:
    2018
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
  • 批准号:
    61675216
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于Phase-type分布的多状态系统可靠性模型研究
  • 批准号:
    71501183
  • 批准年份:
    2015
  • 资助金额:
    17.4 万元
  • 项目类别:
    青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
  • 批准号:
    51201142
  • 批准年份:
    2012
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
  • 批准号:
    11101428
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
  • 批准号:
    19374069
  • 批准年份:
    1993
  • 资助金额:
    6.4 万元
  • 项目类别:
    面上项目

相似海外基金

POSE: Phase II: Credentialing for Open Source Ecosystems (COSE): Ensuring Testable Interoperability
POSE:第二阶段:开源生态系统 (COSE) 认证:确保可测试的互操作性
  • 批准号:
    2303615
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: Building open source ecosystems in molecular sciences through collaboration and technology
POSE:第二阶段:通过协作和技术构建分子科学领域的开源生态系统
  • 批准号:
    2303740
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: Open-Source Precision, High Accuracy and Security Environment (OpenPHASE) For Time Verification, Calibration, and Interoperability
POSE:第二阶段:用于时间验证、校准和互操作性的开源精密、高精度和安全环境 (OpenPHASE)
  • 批准号:
    2303726
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: Building an Open-Source Ecosystem for Deep-Learning Hardware-Software Co-Design
POSE:第二阶段:构建深度学习软硬件协同设计的开源生态系统
  • 批准号:
    2303735
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: Building the Differential Privacy Ecosystem through OpenDP
POSE:第二阶段:通过 OpenDP 构建差分隐私生态系统
  • 批准号:
    2303681
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: Growing GRASS OSE for Worldwide Access to Multidisciplinary Geospatial Analytics
POSE:第二阶段:不断发展 GRASS OSE,以便在全球范围内获得多学科地理空间分析
  • 批准号:
    2303651
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: An Open Source Ecosystem for Collaborative Rapid Design of Edge AI Hardware Accelerators for Integrated Data Analysis and Discovery
POSE:第二阶段:用于协作快速设计边缘人工智能硬件加速器以进行集成数据分析和发现的开源生态系统
  • 批准号:
    2303700
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: A Sustainable Open Source Consortium for the Tock Secure Embedded Operating System
POSE:第二阶段:Tock Secure 嵌入式操作系统的可持续开源联盟
  • 批准号:
    2303639
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: CONNECT: Consortium of Open-source plaNNing models for Next-generation Equitable and efficient Communities and Transportation
POSE:第二阶段:CONNECT:下一代公平高效社区和交通的开源规划模型联盟
  • 批准号:
    2303748
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
POSE: Phase II: An Open-Source Ecosystem for the cvc5 SMT Solver
POSE:第二阶段:cvc5 SMT 求解器的开源生态系统
  • 批准号:
    2303489
  • 财政年份:
    2023
  • 资助金额:
    $ 73.19万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了