RI: Small: Using and Gathering Data for Efficient Batch Reinforcement Learning
RI:小型:使用和收集数据以实现高效的批量强化学习
基本信息
- 批准号:2112926
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Imagine if we could provide each child with the right support, at the right time, for helping them learn best, or to ensure a diabetes patient is being given the best interventions to help them manage their chronic condition over time at home. Unfortunately such personalization is expensive. More scalable computerized approaches can lack the real-time information needed to provide effective personalization, or the ability to specialize interventions. However, the huge rise in more user-friendly software tools means that it is now possible to do such targeted personalization in a broad array of settings. This research will develop new methods for leveraging existing data, and create algorithms to acquire new data in a way that is compatible with the limitations of common systems. This work could help enable personalized interventions across a much broader array of applications than is currently benefiting from such approaches. The research will be particularly focused on the technical challenges arising from areas like education and healthcare.More specifically, this research will create data efficient algorithms and statistical estimators for leveraging past datasets about decisions made and their outcomes, and for acquiring new batch data that might lead to better results to create decision policies-- mappings from features describing the current context to a particular decision or intervention. In particular, the project will center on developing new algorithms that optimize policies with data efficient, minimal assumption lower statistical bounds on their future performance; bound the benefit of gathering a budget of additional data; and, inspired by insights from optimal experimental design, create algorithms for constructing non-adaptive policies that can be used to gather data that then can be leveraged to identify a near-optimal decision policy. The research will focus on both settings where a single decision is made for a particular context, and where a sequence of decisions are made and the decisions made impact the next context observed (common in sequential decision making under uncertainty processes).This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
想象一下,如果我们能在正确的时间为每个孩子提供正确的支持,帮助他们最好地学习,或者确保糖尿病患者得到最好的干预,帮助他们在家里长期控制自己的慢性疾病。不幸的是,这种个性化是昂贵的。更具可扩展性的计算机化方法可能缺乏提供有效个性化所需的实时信息,或者缺乏专门干预措施的能力。然而,越来越多的用户友好型软件工具的出现,意味着现在有可能在广泛的环境中进行这种有针对性的个性化设置。这项研究将开发利用现有数据的新方法,并创建算法,以与通用系统的局限性兼容的方式获取新数据。这项工作可以帮助在更广泛的应用中实现个性化干预,而不是目前从这些方法中受益。这项研究将特别关注教育和医疗保健等领域出现的技术挑战。更具体地说,这项研究将创建有效的数据算法和统计估计器,以利用过去关于决策及其结果的数据集,并获取可能导致更好结果的新批数据,以创建决策策略——从描述当前上下文的特征到特定决策或干预的映射。特别是,该项目将侧重于开发新的算法,以数据效率优化政策,对其未来性能的最小假设更低的统计界限;限制收集额外数据预算的好处;并且,受最优实验设计的启发,创建用于构建非自适应策略的算法,该策略可用于收集数据,然后可以利用这些数据来确定接近最优的决策策略。研究将集中在两种情况下,其中一个单一的决定是为一个特定的环境,并在一系列的决定,并作出的决定影响下一个上下文观察(在不确定性过程下的顺序决策中常见)。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Oracle Inequalities for Model Selection in Offline Reinforcement Learning
- DOI:10.48550/arxiv.2211.02016
- 发表时间:2022-11
- 期刊:
- 影响因子:0
- 作者:Jonathan Lee;G. Tucker;Ofir Nachum;Bo Dai;E. Brunskill
- 通讯作者:Jonathan Lee;G. Tucker;Ofir Nachum;Bo Dai;E. Brunskill
Offline Policy Optimization with Eligible Actions
- DOI:10.48550/arxiv.2207.00632
- 发表时间:2022-07
- 期刊:
- 影响因子:0
- 作者:Yao Liu;Yannis Flet-Berliac;E. Brunskill
- 通讯作者:Yao Liu;Yannis Flet-Berliac;E. Brunskill
Design of Experiments for Stochastic Contextual Linear Bandits
- DOI:
- 发表时间:2021-07
- 期刊:
- 影响因子:0
- 作者:A. Zanette;Kefan Dong;Jonathan Lee;E. Brunskill
- 通讯作者:A. Zanette;Kefan Dong;Jonathan Lee;E. Brunskill
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Emma Brunskill其他文献
Planning in partially-observable switching-mode continuous domains
- DOI:
10.1007/s10472-010-9202-1 - 发表时间:
2010-07-09 - 期刊:
- 影响因子:1.000
- 作者:
Emma Brunskill;Leslie Pack Kaelbling;Tomás Lozano-Pérez;Nicholas Roy - 通讯作者:
Nicholas Roy
Emma Brunskill的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Emma Brunskill', 18)}}的其他基金
IIS-RI: International Conference on Automated Planning and Scheduling (ICAPS) 2017 Doctoral Consortium Travel Awards
IIS-RI:国际自动化规划与调度会议 (ICAPS) 2017 博士联盟旅行奖
- 批准号:
1745800 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Efficient Learning of Personalized Strategies
职业:高效学习个性化策略
- 批准号:
1753968 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Efficient Learning of Personalized Strategies
职业:高效学习个性化策略
- 批准号:
1350984 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: Modeling Co-Decisions: A Computational Framework Using Language and Metadata
RI:小型:共同决策建模:使用语言和元数据的计算框架
- 批准号:
2008761 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Robust Autonomy for Uncertain Systems using Randomized Trees
RI:小型:使用随机树实现不确定系统的鲁棒自治
- 批准号:
2008686 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
RI: Small: Extracting and Representing Commonsense Knowledge Using Language Models
RI:小:使用语言模型提取和表示常识知识
- 批准号:
2006851 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Topology-Aware Image Understanding using Deep Variational Objectives
RI:小型:协作研究:使用深度变分目标的拓扑感知图像理解
- 批准号:
1909038 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Topology-Aware Image Understanding using Deep Variational Objectives
RI:小型:协作研究:使用深度变分目标的拓扑感知图像理解
- 批准号:
1911232 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Toward Human-Level Face Verification Performance Using Distinctive Features
RI:小:利用独特特征实现人类水平的人脸验证性能
- 批准号:
1909707 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: TIDES: Trustworthy Interactive DEcision-making Using Symbolic Planning
RI:小型:潮汐:使用符号规划进行值得信赖的交互式决策
- 批准号:
1910794 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
RI: SMALL: Robust Reinforcement Learning Using Bayesian Models
RI:小:使用贝叶斯模型的鲁棒强化学习
- 批准号:
1815275 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Using Automatically Generated Paraphrases and Discriminative ASR Training to Author Robust Question-Answering Dialogue Systems
RI:小型:使用自动生成的释义和判别性 ASR 训练来编写强大的问答对话系统
- 批准号:
1618336 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
RI: Small: Object Detection, Pose Estimation, and Semantic Segmentation Using 3D Wireframe Models
RI:小:使用 3D 线框模型进行物体检测、姿势估计和语义分割
- 批准号:
1527340 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant