Applications d'un environnement d'apprentissage par renforcement avec un humain dans la boucle

学徒环境中对人类和圆球强化的应用

基本信息

  • 批准号:
    549202-2019
  • 负责人:
  • 金额:
    $ 1.82万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Applied Research and Development Grants - Level 1
  • 财政年份:
    2020
  • 资助国家:
    加拿大
  • 起止时间:
    2020-01-01 至 2021-12-31
  • 项目状态:
    已结题

项目摘要

Reinforcement learning is learning what to do - how to map situations to actions - so as to maximize a numerical reward signal. The learner is not told which actions to take, but instead must discover which actions yield the most reward by trying them. Since RL requires a lot of data, therefore it is most applicable where simulated data is readily available like gameplay, robotics. Here, we consider specifically systems that interact with users in the loop. When a human is involved, there are recurring issues: there is rarely a good simulator, the systems are stochastic and non-stationary, and running them is expensive and/or slow. This is very different from training on a simulated environment where data is effectively unlimited, consequences for poor actions are non-existent and system dynamics are clean and often deterministic. An open-source framework for such a training environment is proposed by the company AI-R, and aims at solving problems of training reinforcement learning algorithms with a human in the loop: non-rewindability, delayed reward functions and unbalanced relevance. The goal of this research project is to use their framework to train a learning agent to teach a human., and we will try to demonstrate that we can effectively teach a human player to play the game Smash Bros. This would enable academics in various fields to use this framework for research where a human behaviour is studied, and open the door to a range of new products and business models for entrepreneurs to develop.
强化学习是学习该做什么——如何将情况映射到行动——从而最大化数字奖励信号。学习者不会被告知采取哪些行动,而是必须通过尝试来发现哪些行动会产生最大的回报。因为强化学习需要大量的数据,所以它最适用于随时可以获得模拟数据的地方,比如游戏玩法、机器人技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Haughey, Roger其他文献

Haughey, Roger的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Haughey, Roger', 18)}}的其他基金

Innovation of Formulation and Manufacturing Process to Improve Natural Health Products
配方和制造工艺创新,改善天然保健品
  • 批准号:
    CCB21-2021-00574
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Technology Partnership Grants
Innovation of Formulation and Manufacturing Process to Improve Natural Health Products
配方和制造工艺创新,改善天然保健品
  • 批准号:
    CCB21-2021-00574
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Technology Partnership Grants
Covid-19 Développement d'un système de désinfection à base de diodes électroluminescentes
Covid-19 消毒系统和电致发光二极管底座的开发
  • 批准号:
    554667-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research Rapid Response to COVID-19
Intelligence artificielle pour la parole intra-auriculaire
耳内言语智能技巧
  • 批准号:
    554367-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1
COVID-19: Samur.AI: Vital signs predictors for COVID-19
COVID-19:Samur.AI:COVID-19 的生命体征预测因子
  • 批准号:
    554728-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research Rapid Response to COVID-19
Élaboration d'une approche d'extraction intelligente de texte de documents numérisés dans le logiciel de gestion de la qualification des sous-traitants de Cognibox
Cognibox 中的潜在特征管理逻辑逻辑文档文本智能提取方法的实验
  • 批准号:
    549287-2019
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Modèle prédictif et implicite des profils usagers pour personnaliser la recommandation des commandes de restaurants d'UEAT
个性化用户配置文件的预测和隐含模块以及餐厅命令的推荐
  • 批准号:
    555979-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Application de l'intelligence artificielle pour personnaliser les thérapies cognitivo-comportementale de l'insomnie TCC-i (Cognitive Behavioral Therapy for Insomnia - CBTi)
TCC-i(失眠认知行为疗法 - CBTi)
  • 批准号:
    549288-2019
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Dématérialisation de documents : cas d'application adapté à l'industrie de l'assurance
文件数字化:CAS dapplication 适应 à lindustrie de lassurance
  • 批准号:
    560434-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Jumeau numérique pour simuler une interface cerveau-machine: un cas d'application pour les troubles du spectre de l'autisme
Jumeau numérique pour simuler une interface cerveau-machine: Un cas dapplication pour les Troubles du Spectre de lautisme
  • 批准号:
    554368-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 1

相似国自然基金

UN-U3Si2复合燃料界面对辐照关键行为的影响研究
  • 批准号:
    U2167217
  • 批准年份:
    2021
  • 资助金额:
    255 万元
  • 项目类别:
    联合基金项目
马克斯克鲁维酵母GX-UN120木糖跨膜运输机制的研究
  • 批准号:
    31760253
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
马克斯克鲁维酵母GX-UN120乙醇脱氢酶基因的功能研究
  • 批准号:
    31560022
  • 批准年份:
    2015
  • 资助金额:
    39.0 万元
  • 项目类别:
    地区科学基金项目
UN-LIBS技术用于工业废水中重金属污染物检测的方法研究
  • 批准号:
    11104153
  • 批准年份:
    2011
  • 资助金额:
    30.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Politiques de commande optimale stochastique à rétroaction pour des systèmes de production et des chaînes logistiques évoluant dans un environnement dynamique
最优随机政治命令和对生产系统和物流链的反作用在环境动态中的作用
  • 批准号:
    RGPIN-2020-05826
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Planification des transports dans un environnement dynamique et stochastique
动态和随机环境中的运输规划
  • 批准号:
    RGPAS-2021-00028
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Planification des transports dans un environnement dynamique et stochastique
动态和随机环境中的运输规划
  • 批准号:
    RGPIN-2021-04037
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Développement et validation d'un programme d'exercices en environnement capacitant améliorant le bien-être de la personne âgée
环境电容训练计划的开发和验证
  • 批准号:
    563343-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Les variations spatio-temporelles de la biodiversité zooplanctonique dans la zone de transition estuarienne du Saint-Laurent face à un environnement changeant
生物多样性的时空变化——浮游动物与圣洛朗河口过渡区的变化以及环境的变化
  • 批准号:
    575309-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
Mise en service d'un banc d'essai en environnement contrôlé
银行环境控制服务管理
  • 批准号:
    572119-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    University Undergraduate Student Research Awards
Interactions écologiques en systèmes agroforestiers intercalaires dans un environnement en changement
跨年农林业与环境变化之间的相互作用
  • 批准号:
    DDG-2020-00020
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Development Grant
Alternateur à stator actif augmentant l'efficacité énergétique de génératrices haute puissance opérant dans un environnement industriel extrême
交流发电机和定子活性增强剂在极端工业环境中具有强大的动力作用
  • 批准号:
    561011-2020
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 3
Alternateur à stator actif augmentant l'efficacité énergétique de génératrices haute puissance opérant dans un environnement industriel extrême
交流发电机和定子活性增强剂在极端工业环境中具有强大的动力作用
  • 批准号:
    561011-2020
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Applied Research and Development Grants - Level 3
Système multi-agents d'évaluation de fonction de récompense pour un robot mobile dans un environnement réel
环境条件下机器人移动补偿功能多智能体评估系统
  • 批准号:
    534718-2019
  • 财政年份:
    2021
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了