CCRI: ENS: Machine Learning Democratization via a Linked, Annotated Repository of Datasets

CCRI:ENS:通过链接、带注释的数据集存储库实现机器学习民主化

基本信息

  • 批准号:
    1925741
  • 负责人:
  • 金额:
    $ 179.3万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Machine learning (ML) is one of the fastest growing research areas within computer science and is enabling a multitude of new applications that span medicine, the sciences, engineering, business, and more. A cornerstone in the steady progress of machine learning over the past 30 years has been regular and continuous systematic empirical comparisons of different ML algorithms on testbed ML datasets. However, as the numbers of ML research papers, algorithms, and datasets all continue to grow rapidly, ML researchers are faced with information overload, making it near impossible to keep track of the latest performance advancements in a systematic manner. In turn, this creates significant inefficiencies for researchers, slowing down the pace of advances in new ML research and applications. This project will address these issues by building upon the success of the existing University of California - Irvine (UCI) Machine Learning Repository, a well-known and widely-used online public repository of ML testbed datasets that ML researchers use to evaluate and track progress in ML algorithm development. This project will extend the Repository with additional information about the datasets and steps to replicate the results; both can significantly amplify the productivity of ML researchers. The project will do so by harnessing significant ML community engagement and outreach in its design and operation, and will also provide training to students from different backgrounds on how to engage with, and contribute to, machine learning research. Given that ML algorithms are now being applied to prediction problems in areas as diverse as climate science, judicial decisions, and personalized medicine, the advances in scientific reproducibility from this project, in terms of systematic evaluation of ML algorithms, have potentially far-reaching societal and scientific benefits. The existing UCI Machine Learning Repository directly impacts tens of thousands of ML researchers and students, by providing a standard and widely-cited set of testbed datasets to support both research and education. This project will involve building the next version of the Repository that will provide rich metadata for ML datasets, linking datasets to research papers and automatically extracting metadata and performance data in leaderboard style. The new Repository will also provide systematic support for reproducible science by allowing users to readily validate empirical ML results on testbed datasets. This project will lead to research advances in two aspects. The first aspect will be the development of new methods and algorithms for information extraction of metadata from the scientific literature. The second aspect will result from improvements in the way ML researchers carry out their experimental work. Providing tools to support broader, more systematic, and more reproducible evaluations of ML algorithms, will lead to ML advances that are more robust, better calibrated, and more likely to operate well when used in real-world environments.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
机器学习(ML)是计算机科学中发展最快的研究领域之一,正在实现跨越医学、科学、工程、商业等领域的众多新应用。在过去的30年里,机器学习稳步发展的一个基石是在测试平台ML数据集上对不同ML算法进行定期和连续的系统经验比较。然而,随着机器学习研究论文、算法和数据集的数量持续快速增长,机器学习研究人员面临着信息过载的问题,几乎不可能以系统的方式跟踪最新的性能进步。反过来,这给研究人员造成了严重的效率低下,减缓了新的机器学习研究和应用的进展速度。该项目将通过建立在现有的加州大学欧文分校(UCI)机器学习存储库的成功基础上来解决这些问题,该存储库是一个知名且广泛使用的ML测试平台数据集的在线公共存储库,ML研究人员使用该存储库来评估和跟踪ML算法开发的进展。该项目将扩展存储库,提供有关数据集和复制结果步骤的额外信息;两者都可以显著提高机器学习研究人员的生产力。该项目将通过在其设计和运营中利用重要的ML社区参与和外展来实现这一目标,并将为来自不同背景的学生提供如何参与和促进机器学习研究的培训。鉴于ML算法现在被应用于气候科学、司法判决和个性化医疗等不同领域的预测问题,从ML算法的系统评估角度来看,该项目在科学可重复性方面的进步具有潜在的深远的社会和科学效益。现有的UCI机器学习存储库通过提供一套标准且被广泛引用的测试平台数据集来支持研究和教育,直接影响了成千上万的机器学习研究人员和学生。该项目将涉及构建Repository的下一个版本,该版本将为ML数据集提供丰富的元数据,将数据集链接到研究论文,并以排行榜风格自动提取元数据和性能数据。新的存储库还将通过允许用户在试验台数据集上轻松验证经验ML结果,为可重复性科学提供系统支持。这个项目将导致两个方面的研究进展。第一个方面将是开发从科学文献中提取元数据信息的新方法和算法。第二个方面将来自机器学习研究人员进行实验工作的方式的改进。提供工具来支持更广泛、更系统、更可重复的ML算法评估,将导致ML的进步,使其更强大、更好地校准,并更有可能在现实环境中使用时运行良好。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Brief Tour of Deep Learning from a Statistical Perspective
从统计角度简要介绍深度学习
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sameer Singh其他文献

Multi-stage Classification for Audio Based Activity Recognition
基于音频的活动识别的多级分类
  • DOI:
    10.1007/11875581_100
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    José Lopes;Charles Lin;Sameer Singh
  • 通讯作者:
    Sameer Singh
A survey of object recognition methods for automatic asset detection in high-definition video
高清视频中自动资产检测的对象识别方法综述
Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills
技能集优化:通过可转移技能强化语言模型行为
  • DOI:
    10.48550/arxiv.2402.03244
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kolby Nottingham;Bodhisattwa Prasad Majumder;Bhavana Dalvi;Sameer Singh;Peter Clark;Roy Fox
  • 通讯作者:
    Roy Fox
ezCoref : A Scalable Approach for Collecting Crowdsourced Annotations for Coreference Resolution
ezCoref:一种收集众包注释以进行共指解析的可扩展方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Crowdsourced;David Bamman;Olivia Lewke;Rachel Bawden;Rico Sennrich;Alexandra Birch;Ari Bornstein;Arie Cattan;Ido Dagan;Hong Chen;Zhenhua Fan;Hao Lu;Alan Yuille;Eduard Hovy;Mitch Marcus;M. Palmer;Lance;Rodney Huddleston. 2002;Frédéric Landragin;T. Poibeau;Bernard Vic;Belinda Z. Li;Gabriel Stanovsky;Robert L Logan;Andrew McCallum;Sameer Singh
  • 通讯作者:
    Sameer Singh
Modeling Performance of Different Classification Methods : Deviation from the Power Law
不同分类方法的建模性能:偏离幂律
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sameer Singh
  • 通讯作者:
    Sameer Singh

Sameer Singh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sameer Singh', 18)}}的其他基金

CAREER: Detecting, Understanding, and Fixing Vulnerabilities in Natural Language Processing Models
职业:检测、理解和修复自然语言处理模型中的漏洞
  • 批准号:
    2046873
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Post hoc Explanations in the Wild: Exposing Vulnerabilities and Ensuring Robustness
合作研究:RI:小型:事后解释:暴露漏洞并确保稳健性
  • 批准号:
    2008956
  • 财政年份:
    2020
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
CRII: RI: Explaining Decisions of Black-box Models via Input Perturbations
CRII:RI:通过输入扰动解释黑盒模型的决策
  • 批准号:
    1756023
  • 财政年份:
    2018
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
RI: Small: Modeling Multiple Modalities for Knowledge-Base Construction
RI:小型:知识库构建的多种模式建模
  • 批准号:
    1817183
  • 财政年份:
    2018
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant

相似国自然基金

基于色氨酸代谢调控ENS途径探讨电针治疗功能性消化不良的作用机制
  • 批准号:
    JCZRLH202500075
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于GDNF/PI3K/AKT信号通路探讨白术七物颗粒调控ENS-ICC-SMC网络治 疗气阴两虚型STC的机制研究
  • 批准号:
    2025JJ90111
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
水稻EnS150基因调控种子休眠和萌发的分子机制研究
  • 批准号:
    32301853
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
岩藻糖基化修饰的MSCs介导GDNF正反馈调控肠神经元焦亡及ENPC自噬促进ENS重建
  • 批准号:
    n/a
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
生孢梭菌通过“IPA-AHR-mTOR”轴调控ENPC自噬参与糖尿病ENS重建的机制研究
  • 批准号:
    82300616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于肠道菌群/5-HT/ENS调控的番茄红素改善肠动力作用机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MSCs胞外囊泡调控ENPC的SETD2/H3K36轴在糖尿病ENS重建中的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于lncRNA Ens6探讨天南星活性成分抑制线粒体分裂促进M2小胶质细胞极化改善缺血性脑卒中的作用机制研究
  • 批准号:
    82003976
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
岩藻糖基化在MSCs介导的ENS重建中的作用及机制研究
  • 批准号:
    81974068
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
从肌层巨噬细胞MM和ENS的Cross-talk 探讨广藿香活性成分对IBS-D肠神经稳态的调节机制
  • 批准号:
    81973586
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235160
  • 财政年份:
    2023
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235157
  • 财政年份:
    2023
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235158
  • 财政年份:
    2023
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
  • 批准号:
    2235159
  • 财政年份:
    2023
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Rôles adaptatifs des symbioses mutualistes hôte-microbiote chez les Téléostéens de l'Amazone
亚马逊河中微生物共生共生的适应性
  • 批准号:
    RGPIN-2019-04802
  • 财政年份:
    2022
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Discovery Grants Program - Individual
CCRI: ENS: Next Generation Tools for Spoken Language Science & Technology
CCRI:ENS:下一代口语科学工具
  • 批准号:
    2120435
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
  • 批准号:
    2120448
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
CCRI: ENS: Evolving the Defects4J Benchmark and Infrastructure to Enable Sustained Innovation and Reproducibility in Software Engineering Research
CCRI:ENS:发展 Defects4J 基准和基础设施以实现软件工程研究的持续创新和可重复性
  • 批准号:
    2120070
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
CCRI: ENS: Activity-Centric Interactive Environments for Embodied AI
CCRI:ENS:以活动为中心的嵌入式人工智能交互环境
  • 批准号:
    2120095
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
    Standard Grant
Altered ENS Neuroimmune Interactions Disrupt Gastrointestinal Motility in Alzheimers Disease
ENS 神经免疫相互作用的改变会破坏阿尔茨海默病的胃肠动力
  • 批准号:
    10653255
  • 财政年份:
    2021
  • 资助金额:
    $ 179.3万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了