RI: Small: Collaborative Research: RUI: Batch Learning from Logged Bandit Feedback

RI:小型:协作研究:RUI:从记录的强盗反馈中批量学习

基本信息

  • 批准号:
    1615679
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-07-01 至 2020-06-30
  • 项目状态:
    已结题

项目摘要

Log data is one of the most ubiquitous forms of data available, as it can be recorded from a variety of systems (e.g., search engines, recommender systems, ad placement platforms) at little cost. Making huge amounts of log data accessible to learning algorithms provides the potential to acquire knowledge at unprecedented scale. Furthermore, the ability to learn from log data can enable effective machine learning even in systems where manual labeling of training data is not economically viable. Log data, however, provides only partial information -- "contextual-bandit feedback" -- limited to the particular actions taken by the system. The feedback for all the other actions the system could have taken is typically not known. This makes learning from log data fundamentally different from traditional supervised learning, where "correct" predictions together with a loss function provide full-information feedback.This project tackles the problem of Batch Learning from Bandit Feedback (BLBF) by developing principled learning methods and algorithms that can be trained with logs containing contextual-bandit feedback. First, the project develops the learning theory of BLBF, especially with respect to understanding the use and design of counterfactual risk estimators for BLBF. Second, the project derives new learning methods for BLBF. Past work has already demonstrated that Conditional Random Fields can be trained in the BLBF setting, and the project derives BLBF analogs of other learning methods as well. Third, the project derives scalable training algorithms for these BLBF methods to enable large-scale applications. And, finally, the project validates the methods with real-world data from operational systems.
日志数据是最普遍存在的可用数据形式之一,因为它可以从各种系统(例如,搜索引擎、推荐系统、广告投放平台)。让学习算法可以访问大量的日志数据,这为以前所未有的规模获取知识提供了可能。此外,从日志数据中学习的能力可以实现有效的机器学习,即使在人工标记训练数据在经济上不可行的系统中。然而,日志数据只提供了部分信息--“上下文强盗反馈”--仅限于系统所采取的特定操作。系统可能采取的所有其他动作的反馈通常是未知的。这使得从日志数据中学习与传统的监督学习有着根本的不同,传统的监督学习是通过“正确”的预测和损失函数提供完整的信息反馈。该项目通过开发原则性学习方法和算法来解决从Bandit反馈中批量学习(BLBF)的问题,这些方法和算法可以使用包含上下文-Bandit反馈的日志进行训练。首先,该项目发展了BLBF的学习理论,特别是在理解BLBF的反事实风险估计器的使用和设计方面。第二,该项目为BLBF衍生了新的学习方法。过去的工作已经证明,条件随机场可以在BLBF设置中进行训练,该项目还衍生出其他学习方法的BLBF类似物。第三,该项目为这些BLBF方法导出可扩展的训练算法,以实现大规模应用。最后,该项目用来自操作系统的真实数据验证了这些方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Douglas Turnbull其他文献

Syntheses, characterisation, and computational studies of tungsten hexafluoride adducts with pyridine and its derivatives
六氟化钨与吡啶及其衍生物加合物的合成、表征和计算研究
  • DOI:
    10.1016/j.jfluchem.2018.08.007
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    1.9
  • 作者:
    Douglas Turnbull;N. Kostiuk;S. Wetmore;M. Gerken
  • 通讯作者:
    M. Gerken
Localify.org: Locally-focus Music Artist and Event Recommendation
Localify.org:本地关注的音乐艺术家和活动推荐
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Douglas Turnbull;April Trainor;Douglas Turnbull;Elizabeth Richards;Kieran Bentley;Victoria Conrad;Paul Gagliano;Cassandra Raineault;Thorsten Joachims
  • 通讯作者:
    Thorsten Joachims
A novel, wave-shaped profile of germline selection of pathogenic mtDNA mutations is discovered by bypassing a classical statistical bias
通过绕过经典的统计偏差,发现了致病性 mtDNA 突变种系选择的新型波形图谱
  • DOI:
    10.1101/2023.11.21.568140
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Auden Cote;Z. Fleischmann;M. Franco;Zhibin Chen;Mark Khrapko;Benjamin Vyshedskiy;Maxim Braverman;K. Popadin;Sarah Pickett;D. Woods;Jonathan L. Tilly;Douglas Turnbull;Konstantin Khrapko
  • 通讯作者:
    Konstantin Khrapko
Lewis Acid Behavior of MoF5 and MoOF4: Syntheses and Characterization of MoF5(NCCH3), MoF5(NC5H5)n, and MoOF4(NC5H5)n (n = 1, 2).
MoF5 和 MoOF4 的路易斯酸行为:MoF5(NCCH3)、MoF5(NC5H5)n 和 MoOF4(NC5H5)n (n = 1, 2) 的合成和表征。
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Janelle Bykowski;Douglas Turnbull;Nolan Hahn;R. Boere;S. Wetmore;Michael Gerken
  • 通讯作者:
    Michael Gerken
Stabilisation of [WF5]+ and WF5 by Pyridine: Facile Access to [WF5(NC5H5)3]+ and WF5(NC5H5)2.
通过吡啶稳定 [WF5] 和 WF5:轻松获得 [WF5(NC5H5)3] 和 WF5(NC5H5)2。
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Gerken;Douglas Turnbull;S. Wetmore;P. Hazendonk
  • 通讯作者:
    P. Hazendonk

Douglas Turnbull的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Douglas Turnbull', 18)}}的其他基金

Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
  • 批准号:
    2312866
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
III: Medium: RUI: Collaborative Research: Counterfactual Learning and Evaluation for Interactive Information Systems
III:媒介:RUI:协作研究:交互式信息系统的反事实学习和评估
  • 批准号:
    1901330
  • 财政年份:
    2019
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: RUI: Learning to Model Sequences
III:小型:协作研究:RUI:学习序列建模
  • 批准号:
    1217485
  • 财政年份:
    2012
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
NSF East Asia Summer Institutes for US Graduate Students
NSF 东亚美国研究生暑期学院
  • 批准号:
    0610260
  • 财政年份:
    2006
  • 资助金额:
    $ 10万
  • 项目类别:
    Fellowship

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232300
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232299
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2334936
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313130
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Evolutionary Approach to Optimal Morphology and Control of Transformable Soft Robots
RI:小型:协作研究:可变形软机器人的最佳形态和控制的进化方法
  • 批准号:
    2325491
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了