CIF: Small: Efficient Sequential Decision-Making and Inference in the Small Data Regime

CIF:小:小数据机制中的高效顺序决策和推理

基本信息

  • 批准号:
    2007834
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Learning from big data has been revolutionizing inference and decision-making, and yet several important applications fall in the small data regime. In this regime, obtaining training samples can be expensive, slow or even hazardous. Thus, there is a critical need for enabling sequential decision-making and inference as data from sequential samples is received over time. This project develops new methods to improve the efficiency and accuracy of sequential decision-making and inference. It will demonstrate the impact of expected outcomes via rigorous and targeted evaluation in applications such as content recommendation systems, clinical trials, distributed machine learning, and hyperparameter tuning. The research outcomes will be published to broad academic and professional audiences and incorporated into teaching curricula via graduate and undergraduate courses. The project will encourage a diverse group of students to participate in research. Through industry partnerships, outcomes of this research will be transitioned quickly to practice.Multi-armed bandit algorithms, which aim to maximize the cumulative reward or identify the best option among a set of choices (referred to as arms), are naturally suited for problems involving sequential decision-making. However, most of the work on multi-armed bandit algorithms assumes independence of the rewards across arms. The objective of the proposed project is to exploit known latent structures and correlation between arms to drastically reduce the sample complexity of multi-armed bandit algorithms. In particular, the investigators aim to design sample-efficient algorithms for two different frameworks: i) the structured bandit framework, where the rewards depend on a common latent feature vector, and ii) a novel correlated bandit framework where reward realizations from arms are correlated with each other. In both frameworks, the project will result in the design of algorithms to maximize the cumulative reward (the exploration-exploitation problem) and to identify the best action/arm as fast as possible (the pure exploration problem). This will be done through a novel and easily generalizable approach to account for the available information on the structure or the correlation among arms to boost the performance of decision-making and inference.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
从大数据中学习已经给推理和决策带来了革命性的变化,但有几个重要的应用属于小数据制度。在这种情况下,获取训练样本可能是昂贵、缓慢甚至危险的。因此,随着来自顺序样本的数据随着时间的推移而被接收,迫切需要能够进行顺序决策和推理。该项目开发了新的方法来提高顺序决策和推理的效率和准确性。它将通过在内容推荐系统、临床试验、分布式机器学习和超参数调整等应用程序中进行严格和有针对性的评估,展示预期结果的影响。研究成果将向广大学术和专业受众发表,并通过研究生和本科课程纳入教学课程。该项目将鼓励不同的学生群体参与研究。通过行业合作,这项研究的成果将迅速转化为实践。多臂强盗算法旨在最大化累积回报或在一组选择(称为ARM)中确定最佳选项,自然适合于涉及顺序决策的问题。然而,大多数关于多臂强盗算法的工作都假设各臂之间的报酬是独立的。该项目的目标是利用已知的潜在结构和臂之间的相关性来显著降低多臂盗贼算法的样本复杂度。特别是,研究人员的目标是为两个不同的框架设计样本高效的算法:i)结构化的强盗框架,其中奖励取决于共同的潜在特征向量;ii)新的相关强盗框架,其中来自ARM的奖励实现彼此关联。在这两个框架中,项目将导致算法的设计,以最大化累积回报(勘探-开采问题),并尽可能快地确定最佳行动/武器(纯勘探问题)。这将通过一种新颖且易于推广的方法来实现,以说明关于结构或ARM之间的相关性的可用信息,以提高决策和推理的性能。该奖项反映了NSF的法定使命,并已通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Blessing of Heterogeneity in Federated Q-learning: Linear Speedup and Beyond
  • DOI:
    10.48550/arxiv.2305.10697
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiin Woo;Gauri Joshi;Yuejie Chi
  • 通讯作者:
    Jiin Woo;Gauri Joshi;Yuejie Chi
Federated Reinforcement Learning: Linear Speedup Under Markovian Sampling
联合强化学习:马尔可夫采样下的线性加速
A Unified Approach to Translate Classical Bandit Algorithms to the Structured Bandit Setting
  • DOI:
    10.1109/jsait.2020.3041246
  • 发表时间:
    2018-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Samarth Gupta;Shreyas Chaudhari;Subhojyoti Mukherjee;Gauri Joshi;Osman Yaugan
  • 通讯作者:
    Samarth Gupta;Shreyas Chaudhari;Subhojyoti Mukherjee;Gauri Joshi;Osman Yaugan
Job Dispatching Policies for Queueing Systems with Unknown Service Rates
Multi-Armed Bandits With Correlated Arms
  • DOI:
    10.1109/tit.2021.3081508
  • 发表时间:
    2021-10-01
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Gupta, Samarth;Chaudhari, Shreyas;Yagan, Osman
  • 通讯作者:
    Yagan, Osman
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Gauri Joshi其他文献

Optimal relay placement for cellular coverage extension
用于扩展蜂窝覆盖范围的最佳中继布局
Budget Impact Analysis of a Computer-Delivered Brief Alcohol Intervention in Veterans Affairs (VA) Liver Clinics: A Randomized Controlled Trial
退伍军人事务部 (VA) 肝脏诊所计算机提供的短暂酒精干预的预算影响分析:随机对照试验
  • DOI:
    10.1080/07347324.2020.1760755
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0.9
  • 作者:
    A. Esmaeili;Wei Yu;Michael A. Cucciare;Ann S Combs;Gauri Joshi;K. Humphreys
  • 通讯作者:
    K. Humphreys
Synergy via Redundancy: Adaptive Replication Strategies and Fundamental Limits
通过冗余实现协同:自适应复制策略和基本限制
Efficient Replication of Queued Tasks to Reduce Latency in Cloud Systems
有效复制排队任务以减少云系统中的延迟
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gauri Joshi
  • 通讯作者:
    Gauri Joshi
Can Your AI Differentiate Cats from Covid-19? Sample Efficient Uncertainty Estimation for Deep Learning Safety
您的 AI 能否将猫与 Covid-19 区分开来?深度学习安全性的样本有效不确定性估计
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ankur Mallick;Chaitanya Dwivedi;B. Kailkhura;Gauri Joshi;Yong Han
  • 通讯作者:
    Yong Han

Gauri Joshi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Gauri Joshi', 18)}}的其他基金

CAREER: Frontiers of Distributed Machine Learning with Communication, Computation and Data Constraints
职业:具有通信、计算和数据约束的分布式机器学习前沿
  • 批准号:
    2045694
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: SHF: Medium: HERMES: On-Device Distributed Machine Learning via Model-Hardware Co-Design
协作研究:SHF:媒介:HERMES:通过模型硬件协同设计实现设备上分布式机器学习
  • 批准号:
    2107024
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CRII: CIF: Unifying Scheduling and Optimization Techniques to Speed-up Distributed Stochastic Gradient Descent
CRII:CIF:统一调度和优化技术来加速分布式随机梯度下降
  • 批准号:
    1850029
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: ARTEMIS: Algorithm-Hardware Co-Design for Efficient Machine Learning Systems
CSR:小型:ARTEMIS:高效机器学习系统的算法硬件协同设计
  • 批准号:
    1815780
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CIF: Small: Efficient and Secure Federated Structure Learning from Bad Data
CIF:小型:高效、安全的联邦结构从不良数据中学习
  • 批准号:
    2341359
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Theory and Algorithms for Efficient and Large-Scale Monte Carlo Tree Search
CIF:小型:高效大规模蒙特卡罗树搜索的理论和算法
  • 批准号:
    2327013
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: SMALL: Theoretical Foundations of Partially Observable Reinforcement Learning: Minimax Sample Complexity and Provably Efficient Algorithms
CIF:SMALL:部分可观察强化学习的理论基础:最小最大样本复杂性和可证明有效的算法
  • 批准号:
    2315725
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Generic Building Blocks of Communication-efficient Computation Networks - Fundamental Limits
CIF:小型:通信高效计算网络的通用构建块 - 基本限制
  • 批准号:
    2221379
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: AF: Small: Energy-Efficient THz Communications Across Massive Dimensions
合作研究:NSF-AoF:CIF:AF:小型:大尺寸的节能太赫兹通信
  • 批准号:
    2225576
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Efficient Model-Based Iterative Reconstruction For High Resolution CT
CIF:小型:基于模型的高效迭代重建高分辨率 CT
  • 批准号:
    2210866
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: AF: Small: Energy-Efficient THz Communications Across Massive Dimensions
合作研究:NSF-AoF:CIF:AF:小型:大尺寸的节能太赫兹通信
  • 批准号:
    2225575
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Learning and estimation with rough non-convex objectives: Fundamental limits and efficient algorithms
CIF:小:具有粗略非凸目标的学习和估计:基本限制和高效算法
  • 批准号:
    2006489
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Resource-Efficient Statistical Inference in Networked Environments
CIF:小型:网络环境中资源高效的统计推断
  • 批准号:
    2007911
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Computationally Efficient Second-Order Optimization Algorithms for Large-Scale Learning
CIF:小型:用于大规模学习的计算高效的二阶优化算法
  • 批准号:
    2007668
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了