CRII:RI: Adaptive and Practical Algorithms for Personalization

CRII:RI:个性化的自适应实用算法

基本信息

  • 批准号:
    1755781
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-05-01 至 2021-04-30
  • 项目状态:
    已结题

项目摘要

Intelligent personalization systems, such as those in news, advertising, search, online shopping, and clinical trials, are playing an increasingly important role in daily lives, bringing to us tremendous convenience as well as increasing the productivity of society. The main challenge in developing algorithmic solutions for these systems lies in the fact that only feedback for the recommended options, but not the other ones, is provided by the users. Many simple heuristics have been used in practice, and there are also some recent advances on more rigorous approaches based on the "contextual bandit" model, referring to an analogy with the objective to maximize the sum of rewards earned through a sequence of lever pulls where an encoding of past performance provides context. However, there is still great room for improvement in terms of both practicality and performance guarantees. This project seeks to develop more practical and adaptive contextual bandit algorithms for such systems. The success of this project requires developing new algorithmic techniques as well as mathematical tools from statistics, optimization, machine learning, and their combinations in an innovative way, which advances the theory and practice of the field of online decision making. Education is integrated into the project through curriculum development and student mentoring. Outreach activities include collaborations with other universities as well as with industry, and also organizing related workshops at top conferences. Specifically, the project aims at designing a family of practical contextual bandit algorithms which not only enjoy some information-theoretic worst-case guarantees but can also achieve much better performance when the problem exhibits some kind of "easiness". First, the project systematically studies different kinds of "easiness" measurements and develops and analyzes specific algorithms for each of these measurements. Second, the project further considers the question of whether it is possible to have a single algorithm that is optimal against all problem instances, where optimality is in terms of the best performance among a reasonable class of algorithms. Finally, the project implements all the developed algorithms and conducts empirical evaluation on benchmark datasets, with the goal of releasing easy-to-use and publicly available software.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
智能个性化系统,如新闻,广告,搜索,在线购物和临床试验,在日常生活中发挥着越来越重要的作用,为我们带来了巨大的便利,并提高了社会的生产力。为这些系统开发算法解决方案的主要挑战在于,用户只提供推荐选项的反馈,而不提供其他选项的反馈。在实践中已经使用了许多简单的策略,最近也有一些基于“情境强盗”模型的更严格方法的进展,指的是一种类比,其目标是通过一系列杠杆拉动来最大化所获得的奖励总和,其中对过去表现的编码提供了背景。不过,无论是实用性还是性能保障方面,都还有很大的提升空间。本项目旨在为此类系统开发更实用和自适应的上下文强盗算法。该项目的成功需要以创新的方式开发新的算法技术以及统计,优化,机器学习及其组合的数学工具,从而推进在线决策领域的理论和实践。通过课程开发和学生辅导,将教育纳入该项目。外展活动包括与其他大学以及行业的合作,并在顶级会议上组织相关研讨会。具体而言,该项目的目的是设计一个家庭的实际上下文强盗算法,不仅享有一些信息理论的最坏情况下的保证,但也可以实现更好的性能时,问题表现出某种“容易”。首先,该项目系统地研究了不同类型的“容易”测量,并开发和分析了这些测量的具体算法。其次,该项目进一步考虑是否有可能有一个单一的算法,是最佳的所有问题的情况下,最优性是在一个合理的算法类中的最佳性能。最后,该项目实施所有开发的算法,并对基准数据集进行实证评估,目标是发布易于使用和公开可用的软件。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Improved Path-length Regret Bounds for Bandits
  • DOI:
  • 发表时间:
    2019-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sébastien Bubeck;Yuanzhi Li;Haipeng Luo;Chen-Yu Wei
  • 通讯作者:
    Sébastien Bubeck;Yuanzhi Li;Haipeng Luo;Chen-Yu Wei
Model Selection for Contextual Bandits
上下文强盗的模型选择
Beating Stochastic and Adversarial Semi-bandits Optimally and Simultaneously
  • DOI:
  • 发表时间:
    2019-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julian Zimmert;Haipeng Luo;Chen-Yu Wei
  • 通讯作者:
    Julian Zimmert;Haipeng Luo;Chen-Yu Wei
Adversarial Online Learning with Changing Action Sets: Efficient Algorithms with Approximate Regret Bounds
具有变化的动作集的对抗性在线学习:具有近似遗憾界限的高效算法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Emamjomeh;Chen;Haipeng Luo;D. Kempe
  • 通讯作者:
    D. Kempe
Open Problem: Model Selection for Contextual Bandits
开放问题:上下文强盗的模型选择
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Haipeng Luo其他文献

Towards Minimax Online Learning with Unknown Time Horizon
迈向未知时间范围的极小极大在线学习
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haipeng Luo;R. Schapire
  • 通讯作者:
    R. Schapire
Clairvoyant Regret Minimization: Equivalence with Nemirovski's Conceptual Prox Method and Extension to General Convex Games
透视遗憾最小化:与 Nemirovski 概念 Prox 方法的等价以及对一般凸博弈的扩展
  • DOI:
    10.48550/arxiv.2208.14891
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gabriele Farina;Christian Kroer;Chung;Haipeng Luo
  • 通讯作者:
    Haipeng Luo
Efficient electro-optical tuning of an optical frequency microcomb on a monolithically integrated high-Q lithium niobate microdisk
  • DOI:
    https://doi.org/10.1364/OL.44.005953
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
  • 作者:
    Zhiwei Fang;Haipeng Luo;Jintian Lin;Min Wang;Jianhao Zhang;Rongbo Wu;Junxia Zhou;Wei Chu;Tao Lu;Ya Cheng
  • 通讯作者:
    Ya Cheng
Optimal and Adaptive Online Learning
最佳和自适应在线学习
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haipeng Luo
  • 通讯作者:
    Haipeng Luo
Lower bounds of Ramsey numbers based on cubic residues
基于立方留数的拉姆齐数下界
  • DOI:
    10.1016/s0012-365x(01)00283-7
  • 发表时间:
    2002-05
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Wenlong Su;Qiao Li;Haipeng Luo;Guiqing Li
  • 通讯作者:
    Guiqing Li

Haipeng Luo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Haipeng Luo', 18)}}的其他基金

CAREER: Learning with Limited Feedback - Beyond Worst-case Optimality
职业生涯:在有限的反馈下学习 - 超越最坏情况的最优性
  • 批准号:
    1943607
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
  • 批准号:
    2025JJ90117
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病 中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
  • 批准号:
    82401112
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
  • 批准号:
    2022J011347
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
  • 批准号:
    2022JJ70115
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

RI: Small: Towards Optimal and Adaptive Reinforcement Learning with Offline Data and Limited Adaptivity
RI:小型:利用离线数据和有限的适应性实现最优和自适应强化学习
  • 批准号:
    2007117
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Mid-Scale RI-1 (M1:IP): FABRIC: Adaptive Programmable Research Infrastructure for Computer Science and Science Applications
中型 RI-1 (M1:IP):FABRIC:计算机科学和科学应用的自适应可编程研究基础设施
  • 批准号:
    1935966
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Cooperative Agreement
RI: Medium: To Sense or Not to Sense: Energy Efficient Adaptive Sensing for Autonomous Systems
RI:中:感知或不感知:自主系统的节能自适应传感
  • 批准号:
    1900821
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
RI: Small: Adaptive Metareasoning for Bounded Rational Agents
RI:小:有限理性智能体的自适应元推理
  • 批准号:
    1813490
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
RI: EAGER: Collaborative Research: Adaptive Heads-up Displays for Simultaneous Interpretation
RI:EAGER:协作研究:用于同声传译的自适应平视显示器
  • 批准号:
    1748663
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
RI: EAGER: Collaborative Research: Adaptive Heads-up Displays for Simultaneous Interpretation
RI:EAGER:协作研究:用于同声传译的自适应平视显示器
  • 批准号:
    1748642
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
RI: Small: RUI: Synthesis of Robust Artificial Systems by Adaptive Genetic Programming
RI:小型:RUI:通过自适应遗传编程合成稳健的人工系统
  • 批准号:
    1617087
  • 财政年份:
    2016
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: RI: Navigational Circuitry of Brain: Novel Neural Codes with Diversity for Robust and Adaptive Location Processing
CRII:RI:大脑导航电路:具有多样性的新颖神经代码,用于鲁棒和自适应位置处理
  • 批准号:
    1464349
  • 财政年份:
    2015
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Decision-Making on Uncertain Spatial-Temporal Fields: Modeling, Planning and Control with Applications to Adaptive Sampling
RI:中:协作研究:不确定时空场的决策:建模、规划和控制及其在自适应采样中的应用
  • 批准号:
    1302393
  • 财政年份:
    2013
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Decision-Making on Uncertain Spatial-Temporal Fields: Modeling, Planning and Control with Applications to Adaptive Sampling
RI:中:协作研究:不确定时空场的决策:建模、规划和控制及其在自适应采样中的应用
  • 批准号:
    1302360
  • 财政年份:
    2013
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了