SHF: Small: Collaborative Research: Programming Tools for Adaptive Data Analysis
SHF:小型:协作研究:自适应数据分析的编程工具
基本信息
- 批准号:1718088
- 负责人:
- 金额:$ 22.44万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2017
- 资助国家:美国
- 起止时间:2017-08-01 至 2020-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
False discovery, or overfitting, occurs when an empirical researcher draws a conclusion based on a dataset that does not generalize to new data. Although there are many statistical methods for preventing false discovery, most are designed for static data analysis, where a dataset is used only once. However, modern data analysis is adaptive, and often the same datasets are reused for multiple studies by multiple researchers. Adaptivity has been identified by statisticians as one cause of non-reproducible research, and this project?s broader significance and importance will be to begin addressing this problem. Specifically, this project will build a prototype programming tool for preventing false discovery arising from adaptive data analysis. The intellectual merits are to incorporate and extend recent theoretical advances on this problem into a programming framework that allows researchers to analyze datasets adaptively with robust guarantees that overfitting will not occur.The project builds on a surprising recent connection between differential privacy and false discovery, a robust statistical guarantee that emerged recently to protect the privacy of sensitive data. This line of work shows that when data is analyzed in a differentially private way, then false discoveries cannot occur. Differential privacy is also programmable, and allows complex differentially private algorithms to be built from simple components, so it is an ideal programming framework for adaptive data analysis. This project is extending existing differentially private programming frameworks to adaptive data analysis. The PIs are also developing new algorithmic and programming languages tools for adaptive data analysis, and incorporating them into the first prototype system for this application.
错误发现或过度拟合,发生在实证研究者基于数据集得出结论时,该数据集并没有推广到新数据。 虽然有许多统计方法可以防止错误发现,但大多数都是针对静态数据分析而设计的,其中数据集只使用一次。 然而,现代数据分析是自适应的,并且通常相同的数据集被多个研究人员重复用于多个研究。 适应性已被统计学家确定为不可重复研究的原因之一,而这个项目?更广泛的意义和重要性将是开始解决这个问题。 具体而言,本项目将建立一个原型编程工具,用于防止自适应数据分析中出现的错误发现。 该项目的智力优势在于将该问题的最新理论进展纳入并扩展到一个编程框架中,该框架允许研究人员自适应地分析数据集,并保证不会发生过拟合。该项目建立在差分隐私和错误发现之间令人惊讶的最新联系之上,这是一种最近出现的强大的统计保证,用于保护敏感数据的隐私。这一系列的工作表明,当数据以不同的私密方式进行分析时,就不会出现错误的发现。差分隐私也是可编程的,并且允许从简单的组件构建复杂的差分隐私算法,因此它是自适应数据分析的理想编程框架。 该项目正在将现有的差异化私人编程框架扩展到适应性数据分析。 PI还在开发用于自适应数据分析的新算法和编程语言工具,并将其纳入该应用程序的第一个原型系统。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The power of factorization mechanisms in local and central differential privacy
- DOI:10.1145/3357713.3384297
- 发表时间:2019-11
- 期刊:
- 影响因子:0
- 作者:Alex Edmonds;Aleksandar Nikolov;Jonathan Ullman
- 通讯作者:Alex Edmonds;Aleksandar Nikolov;Jonathan Ullman
Differentially Private Fair Learning
- DOI:
- 发表时间:2018-12
- 期刊:
- 影响因子:0
- 作者:Matthew Jagielski;Michael Kearns;Jieming Mao;Alina Oprea;Aaron Roth;Saeed Sharifi-Malvajerdi;Jonathan Ullman
- 通讯作者:Matthew Jagielski;Michael Kearns;Jieming Mao;Alina Oprea;Aaron Roth;Saeed Sharifi-Malvajerdi;Jonathan Ullman
Private Identity Testing for High-Dimensional Distributions
高维分布的私有身份测试
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Canonne, Clement;Kamath, Guatam;McMillan, Audra;Ullman, Jonathan;Zakynthinou, Lydia
- 通讯作者:Zakynthinou, Lydia
Efficient Private Algorithms for Learning Large-Margin Halfspaces
用于学习大边缘半空间的高效私有算法
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Nguyen, Huy Le;Ullman, Jonathan;Zakynthinou, Lydia
- 通讯作者:Zakynthinou, Lydia
Efficiently Estimating Erdos-Renyi Graphs with Node Differential Privacy
利用节点差分隐私有效估计鄂尔多斯-仁义图
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Sealfon, Adam;Ullman, Jonathan
- 通讯作者:Ullman, Jonathan
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jonathan Ullman其他文献
Instance-Optimal Differentially Private Estimation
实例最优差分隐私估计
- DOI:
10.48550/arxiv.2210.15819 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Audra McMillan;Adam D. Smith;Jonathan Ullman - 通讯作者:
Jonathan Ullman
How to Combine Membership-Inference Attacks on Multiple Updated Machine Learning Models
如何结合对多个更新的机器学习模型的成员推理攻击
- DOI:
10.56553/popets-2023-0078 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Matthew Jagielski;Stanley Wu;Alina Oprea;Jonathan Ullman;Roxana Geambasu - 通讯作者:
Roxana Geambasu
An Antifolk Theorem for Large Repeated Games
大型重复博弈的反民俗定理
- DOI:
10.1145/2976734 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Mallesh M. Pai;Aaron Roth;Jonathan Ullman - 通讯作者:
Jonathan Ullman
Privacy and the Complexity of Simple Queries
- DOI:
- 发表时间:
2013-09 - 期刊:
- 影响因子:0
- 作者:
Jonathan Ullman - 通讯作者:
Jonathan Ullman
Answering n{2+o(1)} counting queries with differential privacy is hard
- DOI:
10.1145/2488608.2488653 - 发表时间:
2012-07 - 期刊:
- 影响因子:0
- 作者:
Jonathan Ullman - 通讯作者:
Jonathan Ullman
Jonathan Ullman的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jonathan Ullman', 18)}}的其他基金
Collaborative Research: SaTC: CORE: Medium: Private Model Personalization
协作研究:SaTC:核心:媒介:私人模型个性化
- 批准号:
2232692 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SaTC: CORE: Small: Foundations for the Next Generation of Private Learning Systems
协作研究:SaTC:核心:小型:下一代私人学习系统的基础
- 批准号:
2120603 - 财政年份:2021
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
CAREER: A Stable Foundation for Trustworthy Data Analysis
职业:值得信赖的数据分析的稳定基础
- 批准号:
1750640 - 财政年份:2018
- 资助金额:
$ 22.44万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: New Approaches to Decentralized Differential Privacy
SaTC:核心:小型:去中心化差异隐私的新方法
- 批准号:
1816028 - 财政年份:2018
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
- 批准号:
2412357 - 财政年份:2024
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
- 批准号:
2326895 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
- 批准号:
2334624 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
- 批准号:
2232720 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Reimagining Communication Bottlenecks in GNN Acceleration through Collaborative Locality Enhancement and Compression Co-Design
协作研究:SHF:小型:通过协作局部性增强和压缩协同设计重新想象 GNN 加速中的通信瓶颈
- 批准号:
2326494 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
- 批准号:
2234921 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
- 批准号:
2326894 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
- 批准号:
2234920 - 财政年份:2023
- 资助金额:
$ 22.44万 - 项目类别:
Standard Grant