AF: SMALL: Extending the Reach of Distribution Testing via Structure

AF:小:通过结构扩展分布测试的范围

基本信息

  • 批准号:
    2310818
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-06-01 至 2026-05-31
  • 项目状态:
    未结题

项目摘要

We are inundated with a multitude of available data, much of which is naturally viewed as samples from a probability distribution over a large discrete domain. As there is typically no explicit description of the distribution, in order to make effective use of the data, one must develop efficient methods of determining which salient properties are held by the underlying distribution. Such distribution testing tasks are fundamental to scientific analysis, and recent years have seen a leap in our understanding of how to design such algorithms. However, the amount of sample data needed to successfully achieve many of these tasks can be prohibitively large. This project aims to develop algorithms which capitalize on known structures in the data in order to give significantly more efficient solutions. In addition, this project will develop sample-efficient methods of ascertaining whether the data indeed has the claimed structure. This project will include the organization of an annual Workshop on Local Algorithms (WOLA) and will produce publicly available educational material based on current research. The project will also include co-chairing a postdoctoral program specifically aimed at broadening participation and other mentoring activities. The project will engage with high school students in local public schools by giving presentations and serving on advisory committees.This project studies the role of structure in distribution testing. This research will lead to tools for understanding the tradeoffs between the sample complexity required to test properties of distributions and the strength of the assumptions made a priori on the distributions being tested. In a first thrust, algorithms will be developed which capitalize on known (or assumed) existing structural properties in the sample data to give significantly more efficient solutions for estimating information-theoretic quantities and determining whether the data additionally satisfies other structural properties. In a second thrust, new techniques will be developed for designing algorithms to determine whether the data in fact has the assumed structural properties. Unfortunately, for many natural structural properties, the task of testing whether data satisfies these structural properties can be expensive. Fortunately, in many important settings, it can be the case that testing whether the precise structural properties hold is unnecessary. Thus, in a third thrust, this project will consider techniques that bypass the difficulty of testing for structure by testing only that the data has enough structure to make it amenable for use in the settings for which the data is intended. Specifically, such methods allow one to safely use (possibly modified versions of) agnostic learning algorithms that depend on a weaker distributional assumption on the data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
我们被大量可用的数据淹没,其中大部分自然被视为大离散域上概率分布的样本。由于通常没有对分布的明确描述,为了有效地利用数据,必须开发有效的方法来确定底层分布具有哪些显著特性。这种分布测试任务是科学分析的基础,近年来我们对如何设计这种算法的理解有了飞跃。然而,成功实现这些任务中的许多任务所需的样本数据量可能非常大。该项目旨在开发利用数据中已知结构的算法,以提供更有效的解决方案。此外,该项目还将开发样本有效的方法来确定数据是否确实具有所声称的结构。该项目将包括组织一次关于局部算法的年度研讨会,并将根据目前的研究制作公开的教育材料。该项目还将包括共同主持一个专门旨在扩大参与和其他指导活动的博士后项目。该项目将通过演讲和咨询委员会的服务与当地公立学校的高中生接触。该项目研究结构在分布测试中的作用。这项研究将导致工具,了解样本的复杂性,以测试属性的分布和强度的假设被测试的分布先验之间的权衡。在第一个推力,算法将开发利用已知的(或假设的)现有的结构特性的样本数据,以提供更有效的解决方案,估计信息理论的数量,并确定数据是否还满足其他结构特性。在第二个目标中,将开发新技术来设计算法,以确定数据实际上是否具有假设的结构属性。不幸的是,对于许多自然结构属性,测试数据是否满足这些结构属性的任务可能是昂贵的。幸运的是,在许多重要的环境中,测试精确的结构特性是否保持是不必要的。因此,在第三个目标中,本项目将考虑通过测试数据具有足够的结构以使其适用于数据预期的设置来绕过结构测试的困难的技术。具体来说,这种方法允许人们安全地使用(可能是修改版本的)不可知学习算法,这些算法依赖于对数据的较弱分布假设。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Improved Local Computation Algorithms for Constructing Spanners
改进的构造 Spanner 的局部计算算法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Arviv, Ruby;Chung, Lily;Levi, Reut;Pyne, Edward
  • 通讯作者:
    Pyne, Edward
Pseudorandom Linear Codes are List Decodable to Capacity
伪随机线性码可按容量解码列表
Certified Hardness vs. Randomness for Log-Space
对数空间的认证硬度与随机性
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pyne, Edward;Raz, Ran;Zhan, Wei:
  • 通讯作者:
    Zhan, Wei:
On the Power of Regular and Permutation Branching Programs
论正则分支程序和排列分支程序的威力
  • DOI:
    10.4230/lipics.approx/random.2023.44
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chin Ho Lee;Edward Pyne;Salil P. Vadhan
  • 通讯作者:
    Salil P. Vadhan
Near-Optimal Derandomization of Medium-Width Branching Programs
中等宽度分支程序的近乎最优去随机化
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Putterman, Aaron;Edward Pyne
  • 通讯作者:
    Edward Pyne
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ronitt Rubinfeld其他文献

A Self-Tester for Linear Functions over the Integers with an Elementary Proof of Correctness
  • DOI:
    10.1007/s00224-015-9639-z
  • 发表时间:
    2015-06-20
  • 期刊:
  • 影响因子:
    0.400
  • 作者:
    Sheela Devadas;Ronitt Rubinfeld
  • 通讯作者:
    Ronitt Rubinfeld
On the time and space complexity of computation using write-once memory or is pen really much worse than pencil?
  • DOI:
    10.1007/bf02835833
  • 发表时间:
    1992-06-01
  • 期刊:
  • 影响因子:
    0.400
  • 作者:
    Sandy Irani;Moni Naor;Ronitt Rubinfeld
  • 通讯作者:
    Ronitt Rubinfeld
Learning fallible Deterministic Finite Automata
  • DOI:
    10.1007/bf00993409
  • 发表时间:
    1995-02-01
  • 期刊:
  • 影响因子:
    2.900
  • 作者:
    Dana Ron;Ronitt Rubinfeld
  • 通讯作者:
    Ronitt Rubinfeld
Exactly Learning Automata of Small Cover Time
  • DOI:
    10.1023/a:1007348927491
  • 发表时间:
    1997-04-01
  • 期刊:
  • 影响因子:
    2.900
  • 作者:
    Dana Ron;Ronitt Rubinfeld
  • 通讯作者:
    Ronitt Rubinfeld

Ronitt Rubinfeld的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ronitt Rubinfeld', 18)}}的其他基金

AF: Small: Sparsity in Local Computation
AF:小:局部计算的稀疏性
  • 批准号:
    2006664
  • 财政年份:
    2020
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
AitF: Collaborative Research: Fast, Accurate, and Practical: Adaptive Sublinear Algorithms for Scalable Visualization
AitF:协作研究:快速、准确和实用:用于可扩展可视化的自适应次线性算法
  • 批准号:
    1733808
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
BIGDATA: F: Testing High Dimensional Distributions without the Curse of Dimensionality
BIGDATA:F:在没有维数灾难的情况下测试高维分布
  • 批准号:
    1741137
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
EAGER: Testing Pseudorandom Distributions
EAGER:测试伪随机分布
  • 批准号:
    1650733
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
AF: Small: New directions in the design of local computation algorithms
AF:小:局部计算算法设计的新方向
  • 批准号:
    1420692
  • 财政年份:
    2014
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
AF: Small: Local Computation Algorithms
AF:小:本地计算算法
  • 批准号:
    1217423
  • 财政年份:
    2012
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
AF: Medium: Taming Masssive Data with Sub-Linear Algorithms
AF:中:用次线性算法驯服海量数据
  • 批准号:
    1065125
  • 财政年份:
    2011
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
MSPA-MCS: Learning to Rank
MSPA-MCS:学习排名
  • 批准号:
    0732334
  • 财政年份:
    2007
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
The Complexity of Testing Distributions
测试分布的复杂性
  • 批准号:
    0514771
  • 财政年份:
    2005
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CAREER: Algorithms for Self-testing/Correcting Program and Learning
职业:自我测试/纠正程序和学习的算法
  • 批准号:
    9624552
  • 财政年份:
    1996
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

SHF: Small: A Mechanism for Extending A Programming Language with Interactive Syntax
SHF:小型:一种用交互式语法扩展编程语言的机制
  • 批准号:
    2007686
  • 财政年份:
    2020
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CSR: Small: Extending Smartphone Battery Life via Prescriptive Energy Profiling
CSR:小:通过规范的能量分析延长智能手机电池寿命
  • 批准号:
    1718854
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Extending life in refractory medulloblastoma patients with cancer stem cell killing small molecules
利用癌症干细胞杀伤小分子延长难治性髓母细胞瘤患者的生命
  • 批准号:
    355937
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Operating Grants
RI: Small: Extending Verb Semantics with Causality towards Physical World
RI:小:将动词语义与因果关系扩展到物理世界
  • 批准号:
    1617682
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
AF: Small: Extending algorithms for topological notions of similarity
AF:小:相似性拓扑概念的扩展算法
  • 批准号:
    1614562
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
III: Small: Exploiting and Extending Integer Linear Programming in Computational Biology
III:小:在计算生物学中利用和扩展整数线性规划
  • 批准号:
    1528234
  • 财政年份:
    2015
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Investigating and Extending Bayesian Methods for Small Area Estimation
研究和扩展小区域估计的贝叶斯方法
  • 批准号:
    8912527
  • 财政年份:
    2014
  • 资助金额:
    $ 60万
  • 项目类别:
Investigating and Extending Bayesian Methods for Small Area Estimation
研究和扩展小区域估计的贝叶斯方法
  • 批准号:
    8769041
  • 财政年份:
    2014
  • 资助金额:
    $ 60万
  • 项目类别:
III: Small: Extending and Automating Dynamic Specialization of Database Management Systems
III:小型:扩展和自动化数据库管理系统的动态专业化
  • 批准号:
    1318343
  • 财政年份:
    2013
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
HCC: Small: Programming by Voice: Extending Initial Programming Environments for Children with Disabilities
HCC:小型:语音编程:为残疾儿童扩展初始编程环境
  • 批准号:
    1117940
  • 财政年份:
    2011
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了