Deep Bayesian Reinforcement Learning
深度贝叶斯强化学习
基本信息
- 批准号:522237-2018
- 负责人:
- 金额:$ 0.79万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Engage Plus Grants Program
- 财政年份:2018
- 资助国家:加拿大
- 起止时间:2018-01-01 至 2019-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The proposed Engage Plus grant will continue to explore the utility of Bayesian Reinforcement Learning (BRL)**and integrate it in to the High Performance computing (HPC) framework of Sightline. In general**Reinforcement Learning (RL), is a class of machine learning (ML) methods in which a software agent interacts**with an unknown environment, with the goal of learning or finding a policy, to optimize some performance**metric. Underlying models include Markov Decision Processes and their variants. BRL is typically competitive**and unsupervised with the objective of attempting to estimate a random variable by producing a probability**distribution for it. Although well-thought-out and well-designed, BRL has not been widely applied or adopted.**BRL is still in relative infancy in spite of demonstrated successes and this aspect is of direct interest to**Sightline who are approaching machine learning from the application perspective. It is anticipated that the**combination of powerful models for policy approximation such as those associated with deep probabilistic**networks in combination with a BRL approach can further facilitate better exploration-exploitation trade-offs**associated with policy optimization. This Engage Plus opportunity will provide Sightline with another ML**offering to add to its suite of analytics tools and explore the underutilized and untapped potential of BRL.
拟议的Engage Plus拨款将继续探索贝叶斯强化学习(BRL)**的效用,并将其整合到Sightline的高性能计算(HPC)框架中。一般来说,强化学习(RL)是一类机器学习(ML)方法,其中软件代理与未知环境进行交互,以学习或找到策略为目标,以优化某些性能指标。基础模型包括马尔可夫决策过程及其变体。BRL是典型的竞争性和无监督的,其目的是试图通过产生随机变量的概率分布来估计随机变量。BRL虽然经过深思熟虑和精心设计,但并没有得到广泛的应用和采纳。尽管取得了成功,但BRL仍处于相对起步阶段,这方面对从应用角度接近机器学习的**Sightline有直接的兴趣。可以预见的是,将强大的策略逼近模型(如与深度概率网络相关的模型)与BRL方法相结合,可以进一步促进与策略优化相关的更好的勘探-开发权衡。这次Engage Plus的机会将为Sightline提供另一个ML**产品,以增加其分析工具套件,并探索BRL未充分利用和未开发的潜力。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
McLeod, Robert其他文献
Resolution of Othello Syndrome After Subthalamic Nucleus Deep Brain Stimulation in 3 Patients with Parkinson's Disease
- DOI:
10.1002/mdc3.12084 - 发表时间:
2014-12-01 - 期刊:
- 影响因子:4
- 作者:
Adam, Robert J.;McLeod, Robert;Fung, Victor S. C. - 通讯作者:
Fung, Victor S. C.
McLeod, Robert的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('McLeod, Robert', 18)}}的其他基金
A Smartphone Framework for Mild Cognitive Impairment Assessment
用于轻度认知障碍评估的智能手机框架
- 批准号:
RGPIN-2018-06041 - 财政年份:2022
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
A Smartphone Framework for Mild Cognitive Impairment Assessment
用于轻度认知障碍评估的智能手机框架
- 批准号:
RGPIN-2018-06041 - 财政年份:2021
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
A Smartphone Framework for Mild Cognitive Impairment Assessment
用于轻度认知障碍评估的智能手机框架
- 批准号:
RGPIN-2018-06041 - 财政年份:2020
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
Machine learning methods for alarm detection and prediction
用于警报检测和预测的机器学习方法
- 批准号:
535755-2018 - 财政年份:2018
- 资助金额:
$ 0.79万 - 项目类别:
Engage Grants Program
A Smartphone Framework for Mild Cognitive Impairment Assessment
用于轻度认知障碍评估的智能手机框架
- 批准号:
RGPIN-2018-06041 - 财政年份:2018
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
Computer vision and deep learning: Bayesian Reinforcement Learning
计算机视觉和深度学习:贝叶斯强化学习
- 批准号:
512242-2017 - 财政年份:2017
- 资助金额:
$ 0.79万 - 项目类别:
Engage Grants Program
Institutional Agent Based Models for Healthcare Applications (Simstitution)
用于医疗保健应用的基于机构代理的模型 (Simstitution)
- 批准号:
6712-2012 - 财政年份:2016
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
Institutional Agent Based Models for Healthcare Applications (Simstitution)
用于医疗保健应用的基于机构代理的模型 (Simstitution)
- 批准号:
6712-2012 - 财政年份:2015
- 资助金额:
$ 0.79万 - 项目类别:
Discovery Grants Program - Individual
Vehicular traffic counts from wireless network protocols
根据无线网络协议计算车辆流量
- 批准号:
479818-2015 - 财政年份:2015
- 资助金额:
$ 0.79万 - 项目类别:
Engage Grants Program
Extensions to Bluetooth/WiFi for Vehicular and Pedestrian Traffic Monitoring
用于车辆和行人交通监控的蓝牙/WiFi 扩展
- 批准号:
491462-2015 - 财政年份:2015
- 资助金额:
$ 0.79万 - 项目类别:
Engage Plus Grants Program
相似国自然基金
多元纵向数据与复发事件和终止事件的Bayesian联合模型研究
- 批准号:82173628
- 批准年份:2021
- 资助金额:52 万元
- 项目类别:面上项目
三维地质模型约束下地球化学场的Bayesian-MCMC推断
- 批准号:42072326
- 批准年份:2020
- 资助金额:63 万元
- 项目类别:面上项目
基于Bayesian Kriging模型的压射机构稳健优化设计基础研究
- 批准号:51875209
- 批准年份:2018
- 资助金额:59.0 万元
- 项目类别:面上项目
X射线图像分析中的MCMC-Bayesian理论与计算方法研究
- 批准号:U1830105
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:联合基金项目
基于Bayesian位移场的SAR图像精确配准方法研究
- 批准号:41601345
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
多结局Bayesian联合生存模型及糖尿病并发症预测研究
- 批准号:81673274
- 批准年份:2016
- 资助金额:50.0 万元
- 项目类别:面上项目
基于Meta流行病学和Bayesian方法构建针刺干预无偏倚风险效果评价体系研究
- 批准号:81403276
- 批准年份:2014
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
BtoC电子商务中基于分层Bayesian网络的信任与声誉计算理论研究
- 批准号:71302080
- 批准年份:2013
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Bayesian网络的坚硬顶板条件下煤与瓦斯突出预警控制机理研究
- 批准号:51274089
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Bayesian实物期权及在信用风险决策中的应用
- 批准号:71071027
- 批准年份:2010
- 资助金额:23.0 万元
- 项目类别:面上项目
相似海外基金
Scalable Bayesian Reinforcement Learning in the Games Industry
游戏行业中的可扩展贝叶斯强化学习
- 批准号:
2890029 - 财政年份:2023
- 资助金额:
$ 0.79万 - 项目类别:
Studentship
Affordable High Quality Control Using Structured Bayesian Reinforcement Learning for Articulated Robot in Biomedical Applications
使用结构化贝叶斯强化学习对生物医学应用中的铰接式机器人进行经济实惠的高质量控制
- 批准号:
23K16976 - 财政年份:2023
- 资助金额:
$ 0.79万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Deep Bayesian Reinforcement Learning in Changing Environments
不断变化的环境中的深度贝叶斯强化学习
- 批准号:
2724208 - 财政年份:2022
- 资助金额:
$ 0.79万 - 项目类别:
Studentship
Fully Bayesian Reinforcement Learning for Control of Continuous Industrial Processes
用于控制连续工业过程的完全贝叶斯强化学习
- 批准号:
2640133 - 财政年份:2021
- 资助金额:
$ 0.79万 - 项目类别:
Studentship
Safe Artificial Intelligence with Bayesian Reinforcement Learning
通过贝叶斯强化学习实现安全人工智能
- 批准号:
534795-2019 - 财政年份:2021
- 资助金额:
$ 0.79万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Safe Artificial Intelligence with Bayesian Reinforcement Learning
通过贝叶斯强化学习实现安全人工智能
- 批准号:
534795-2019 - 财政年份:2020
- 资助金额:
$ 0.79万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Safe Artificial Intelligence with Bayesian Reinforcement Learning
通过贝叶斯强化学习实现安全人工智能
- 批准号:
534795-2019 - 财政年份:2019
- 资助金额:
$ 0.79万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
RTML: Small: Real-Time Model-Based Bayesian Reinforcement Learning
RTML:小型:基于实时模型的贝叶斯强化学习
- 批准号:
1937396 - 财政年份:2019
- 资助金额:
$ 0.79万 - 项目类别:
Standard Grant
RI: SMALL: Robust Reinforcement Learning Using Bayesian Models
RI:小:使用贝叶斯模型的鲁棒强化学习
- 批准号:
1815275 - 财政年份:2018
- 资助金额:
$ 0.79万 - 项目类别:
Standard Grant