Robust Actor-Critic Algorithms for Reinforcement Learning.
用于强化学习的稳健的 Actor-Critic 算法。
基本信息
- 批准号:443153-2013
- 负责人:
- 金额:$ 1.27万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Alexander Graham Bell Canada Graduate Scholarships - Master's
- 财政年份:2013
- 资助国家:加拿大
- 起止时间:2013-01-01 至 2014-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
No summary - Aucun sommaire
无摘要- Aucun sommaire
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dick, Travis其他文献
Learning to Link
学习链接
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Balcan, Maria-Florina;Dick, Travis;Lang, Manuel - 通讯作者:
Lang, Manuel
Confidence-ranked reconstruction of census microdata from published statistics.
- DOI:
10.1073/pnas.2218605120 - 发表时间:
2023-02-21 - 期刊:
- 影响因子:11.1
- 作者:
Dick, Travis;Dwork, Cynthia;Kearns, Michael;Liu, Terrance;Roth, Aaron;Vietri, Giuseppe;Wu, Zhiwei Steven - 通讯作者:
Wu, Zhiwei Steven
Random Smoothing Might be Unable to Certify L_infinity Robustness for High-Dimensional Images
随机平滑可能无法证明高维图像的 L_infinity 鲁棒性
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:6
- 作者:
Blum, Avrim;Dick, Travis;Manoj, Naren;Zhang, Hongyang - 通讯作者:
Zhang, Hongyang
Learning to Branch
学习分支
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Balcan, Maria-Florina;Dick, Travis;Sandholm, Tuomas - 通讯作者:
Sandholm, Tuomas
Algorithms and Learning for Fair Portfolio Design
公平投资组合设计的算法和学习
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Diana, Emily;Dick, Travis;Elzayn, Hadi;Kearns, Michael;Roth, Aaron;Schutzman, Zachary;Sharifi-Malvajerdi, Saeed;Ziani, Juba - 通讯作者:
Ziani, Juba
Dick, Travis的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dick, Travis', 18)}}的其他基金
Pattern learning for monte-carlo tree search
蒙特卡罗树搜索的模式学习
- 批准号:
382881-2009 - 财政年份:2009
- 资助金额:
$ 1.27万 - 项目类别:
University Undergraduate Student Research Awards
相似国自然基金
基于深度时间差分Actor-Critic 策略的航行体时空复合大数据学习及避障控制
- 批准号:21ZR1426600
- 批准年份:2021
- 资助金额:0.0 万元
- 项目类别:省市级项目
连续动作空间深度Actor-Critic算法研究
- 批准号:61762032
- 批准年份:2017
- 资助金额:36.0 万元
- 项目类别:地区科学基金项目
相似海外基金
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
- 批准号:
2153510 - 财政年份:2022
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
- 批准号:
2313351 - 财政年份:2022
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
Actor-Critic-Like Stochastic Adaptive Search Algorithms for Simulation Optimization
用于仿真优化的类似 Actor-Critic 的随机自适应搜索算法
- 批准号:
1634627 - 财政年份:2016
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
- 批准号:
405275-2011 - 财政年份:2013
- 资助金额:
$ 1.27万 - 项目类别:
Postdoctoral Fellowships
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
- 批准号:
405275-2011 - 财政年份:2012
- 资助金额:
$ 1.27万 - 项目类别:
Postdoctoral Fellowships
Restoration and Further Assessment of the Actor-Critic Circuit and Connected Areas After Cocaine Self-Administration
可卡因自我给药后演员-评论家回路和连接区域的恢复和进一步评估
- 批准号:
9412155 - 财政年份:2011
- 资助金额:
$ 1.27万 - 项目类别:
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
- 批准号:
405275-2011 - 财政年份:2011
- 资助金额:
$ 1.27万 - 项目类别:
Postdoctoral Fellowships
Restoration and Further Assessment of the Actor-Critic Circuit and Connected Areas After Cocaine Self-Administration
可卡因自我给药后演员-评论家回路和连接区域的恢复和进一步评估
- 批准号:
10634903 - 财政年份:2011
- 资助金额:
$ 1.27万 - 项目类别: