RI: Small: Statistically Sound and Computationally Efficient Data Analysis Through Algorithmic Applications of Rademacher Averages

RI:小:通过 Rademacher 平均值的算法应用进行统计上合理且计算高效的数据分析

基本信息

  • 批准号:
    1813444
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2023-08-31
  • 项目状态:
    已结题

项目摘要

Machine learning and data mining are among the most influential contributions of computer science in the last decade. Given sufficiently large datasets and computational power one can discover patterns and make reasonably accurate predictions. While there has been tremendous progress in designing efficient algorithms for analyzing massive datasets, there has been less progress in providing rigorous measures of statistical significance or robustness of the analysis. As we analyze large and noisy datasets to model complex relationships in data, it is critical to develop formally proven methods with clear performance guarantees. This project advocates a responsible approach to data analysis, based on well-founded mathematical and statistical concepts. Such an approach enhances the effectiveness and reliability of evidence- based decision making in medicine, policy and other social applications of big data analysis. Capacity-building activities of this project include: (1) Creation and dissemination of algorithms and software that implement rigorous, interpretable, and usable computational and statistical approaches to big data analysis; and (2) Educational initiatives at the graduate and undergraduate level to build a bigger and more diverse workforce of data scientists with the appropriate foundational skills both to apply analytical tools to existing datasets and to develop new approaches to future datasets.The goal of this project is developing practical data analysis algorithmic applications based on the theoretical machine learning concept of Rademacher complexity. This project is motivated by preliminary results that have shown that the analytical properties of the Rademacher complexity, combined with its efficient sampling properties, provide a unique opportunity to develop general tools to begin bridging the gap between theory and practice in large scale data analysis. In particular, the project is focused on the following aims: improve the efficiency of rigorous data analysis algorithms through better sample complexity bounds; improve multi-comparisons and overfitting control through Rademacher generalization bounds; develop theory and practical applications of Cartesian and Chaos Rademacher Complexities; develop efficient algorithms for estimating the empirical Rademacher complexity; and explore new rigorous data analysis algorithms through the application of Rademacher theory.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
机器学习和数据挖掘是过去十年中计算机科学最有影响力的贡献之一。 只要有足够大的数据集和计算能力,人们就可以发现模式并做出相当准确的预测。 虽然在设计用于分析大规模数据集的有效算法方面取得了巨大进展,但在提供统计显著性或分析鲁棒性的严格措施方面进展较少。当我们分析大型和嘈杂的数据集来建模数据中的复杂关系时,开发具有明确性能保证的正式验证方法至关重要。 该项目倡导以可靠的数学和统计概念为基础,采取负责任的方法进行数据分析。这种方法增强了大数据分析在医学、政策和其他社会应用中循证决策的有效性和可靠性。该项目的能力建设活动包括:(1)创建和传播算法和软件,对大数据分析采用严格、可解释和可用的计算和统计方法;以及(2)在研究生和本科阶段的教育计划,以建立一个更大,更多样化的数据科学家的劳动力与适当的基础技能,既应用分析工具,以现有的数据集,该项目的目标是基于Rademacher复杂性的理论机器学习概念开发实际的数据分析算法应用程序。这个项目的动机是初步的结果表明,分析性能的Rademacher复杂性,结合其有效的采样性能,提供了一个独特的机会,开发通用工具,开始弥合差距之间的理论和实践在大规模数据分析。具体而言,该项目的重点是以下目标:通过更好的样本复杂性界限提高严格数据分析算法的效率;通过Rademacher推广界限改进多重比较和过拟合控制;发展笛卡尔和混沌Rademacher复杂性的理论和实际应用;开发用于估计经验Rademacher复杂性的有效算法;该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
RePBubLik: Reducing Polarized Bubble Radius with Link Insertions
Learning Simulation-Based Games from Data
  • DOI:
  • 发表时间:
    2019-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Enrique Areyan Viqueira;A. Greenwald;Cyrus Cousins;E. Upfal
  • 通讯作者:
    Enrique Areyan Viqueira;A. Greenwald;Cyrus Cousins;E. Upfal
Tiered Sampling: An Efficient Method for Counting Sparse Motifs in Massive Graph Streams
分层采样:一种计算海量图流中稀疏图案的有效方法
Democratizing Data Science through Interactive Curation of ML Pipelines
  • DOI:
    10.1145/3299869.3319863
  • 发表时间:
    2019-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zeyuan Shang;Emanuel Zgraggen;Benedetto Buratti;Ferdinand Kossmann;P. Eichmann;Yeounoh Chung;Carsten Binnig;E. Upfal;Tim Kraska
  • 通讯作者:
    Zeyuan Shang;Emanuel Zgraggen;Benedetto Buratti;Ferdinand Kossmann;P. Eichmann;Yeounoh Chung;Carsten Binnig;E. Upfal;Tim Kraska
Uncertainty and the Social Planner’s Problem: Why Sample Complexity Matters
不确定性和社会规划者的问题:为什么样本复杂性很重要
  • DOI:
    10.1145/3531146.3533243
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cousins, Cyrus
  • 通讯作者:
    Cousins, Cyrus
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eli Upfal其他文献

Brain Functional Connectivity Estimation Utilizing Diffusion Kernels on a Structural Connectivity Graph
利用结构连接图上的扩散核进行大脑功能连接估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nathan Tung;J. Sanes;Eli Upfal;A. Eloyan
  • 通讯作者:
    A. Eloyan
Bruisable Onions: Anonymous Communication in the Asynchronous Model
碎洋葱:异步模型中的匿名通信
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Megumi Ando;Anna Lysyanskaya;Eli Upfal
  • 通讯作者:
    Eli Upfal
De Novo Discovery of Mutated Driver Pathways in Cancer Material Supplemental Related Content
从头发现癌症材料中突变的驱动通路材料补充相关内容
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fabio Vandin;Eli Upfal;Benjamin J. Raphael;F. Hormozdiari;Iman Hajirasouliha;Andrew Mcpherson
  • 通讯作者:
    Andrew Mcpherson
On-line routing of random calls in networks
  • DOI:
    10.1007/s00440-002-0242-2
  • 发表时间:
    2003-04-01
  • 期刊:
  • 影响因子:
    1.600
  • 作者:
    Malwina J. Luczak;Colin McDiarmid;Eli Upfal
  • 通讯作者:
    Eli Upfal

Eli Upfal的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eli Upfal', 18)}}的其他基金

BIGDATA: Mid-Scale: DA: Analytical Approaches to Massive Data Computation with Applications to Genomics
BIGDATA:中型:DA:海量数据计算的分析方法及其在基因组学中的应用
  • 批准号:
    1247581
  • 财政年份:
    2012
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Efficient Distributed Approximation Algorithms
高效的分布式逼近算法
  • 批准号:
    1023166
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
ITR/SY Algorithmic Issues in Large Scale Dynamic Networks
大规模动态网络中的 ITR/SY 算法问题
  • 批准号:
    0121154
  • 财政年份:
    2001
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Design and Analysis of Dynamic Processes: A Stochastic Approach
动态过程的设计和分析:随机方法
  • 批准号:
    9731477
  • 财政年份:
    1998
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了